2023年3月15日,GPT-4的发布再次引爆互联网,原有的自然语言理解、推理和对话能力继续增强,更引入了识图等多模态识别功能,有研究认为可以将其视为“通用性人工智能”的初步阶段。在国内,百度同类产品“文心一言“的发布同样引起了极大关注。
本文通过蚁坊软件的大数据舆情舆论分析系统,仅尝试从社会生产力影响、社会文化影响舆论动员能力、互联网产业影响、网络数据安全影响角度做浅析。
1. 社会生产力
工作效率方面,该类产品在一些领域可以显著的提高工作效率。目前来看,ChatGPT类产品和技术在外语翻译、写作辅助、编程辅助等领域都体现出了非常好的效果。其对专业技术文章的快速总结能力也已经得到了验证。在其他一些较为小众的专业领域,也可以通过诸如ChatGPT Retrieval Plugin这样的插件结合专业文档来得到一个帮助用户快速入门和检索的问答式机器人。OpenAI的研究人员估计 ChatGPT 和使用该程序构建的未来应用可能影响美国大约 19% 的工作岗位,和他们至少 50% 的工作任务(相关论文:arxiv.org/pdf/2303.10130v1.pdf )。
总体来说,该类产品还是会显著的增加各行各业的生产力。
2. 舆论动员能力
该类应用的舆论动员能力主要体现在显式和隐式两个方面。
显式方面,因为该类应用可能会发展成为新的互联网流量入口。其首页上的推荐信息等会成为新闻门户,其影响力类似于现有其他类互联网门户。
隐式方面则更为重要。在有大量用户的前提下,语言模型可以被认为获得了对世界观价值观人生观的解释权。语言模型的意识形态是隐藏在训练数据和训练过程中的,无法直接通过文字或代码来检查验证。在2022年12月,清华大学·交叉信息研究院·助理教授于洋带领团队对GPT-2做了性别歧视水平评估,测试结果发现其存在一定的歧视行为。2月份 OpenAI 首席执行官 Sam Altman 在 2 月初发推文表示其在偏见方面存在偏见。
虽然语言模型的偏见是不可避免的,但从另一个角度来说,正式上市的语言模型,包括国外的ChatGPT类,整体还是表现出了较高的伦理/道德水准,相对于日常人们接触到的互联网环境,接触ChatGPT带来的影响可能更为正面。对语言模型只需加以监管和引导,其益处会明显大于坏处。非正式上市的语言模型,因可能不做伦理方面的训练而更容易被用作灰产,这类产品可以生成大量的争议性文章用作引流、在封闭性社群挑逗吸粉等,如果被用作未成年教育可能危害极大。
教育领域,ChatGPT是否可应用于教学,特别是大学生在完成作业时能否使用ChatGPT也产生了巨大争议。
除了对话类产品,还应该考虑ChatGPT类技术带来的影响。ChatGPT类技术可以在短期内生成大量的同类但不完全相同的文章,目前已可被用于灰产、批量广告、SEO技术等。如果和水军机器人技术结合,可能会产生大量以假乱真的帖子搅乱互联网空间。对互联网平台和管理部门而言,如何监控人工智能生成的批量数据是个新的监管难点。
3. 互联网产业的影响
该类应用可能会重塑互联网格局。ChatGPT成为最快达到1亿月活用户的互联网公司。根据分析公司Similarweb的数据,在微软将OpenAI的AI聊天技术整合到搜索引擎必应(Bing)之后,必应的页面访问量较一个月前增长15.8%,而谷歌同期搜索引擎的访问量下降了近1%。在ChatGPT开放插件体系后,已有预测其将成为一个新的互联网门户。
4. 网络数据安全
OpenAI作为一个已AI研究起家的小公司,其产品能力要明显弱于其他老牌互联网大厂,上线以来已经历过多轮宕机和数据丢失现象。3月25日,OpenAI公司披露有1.2% 的 ChatGPT Plus 用户可能向其他用户泄露了个人数据。
从OpenAI和隐私协议看,用户在使用ChatGPT期间的提示和回复等数据,将被该公司继续用于训练AI算法模型。这也是ChatGPT能力可以持续提升,保持对其他同类产品竞争力的一个重要原因。
如果国外产品在国内提供服务,主管部门需要考虑跨境数据的安全问题以及产品本身的安全能力。如果是国内产品在国内提供服务,也需要考虑其训练数据是否确实剔除了隐私内容,特别是有多项业务的互联网大厂,是否会挪用用户的输入。(相关内容参考传送)