- ChatGPT(英文全称:Chat Generative Pre-trained Transformer,聊天生成预训练转换器)是人工智能研究实验室OpenAI(开放人工智能研究中心)在2022年发布的聊天机器人模型。
- ChatGPT基于GPT-3.5系列,并使用强化学习算法来训练。它以对话的方式与用户进行交互,通过模仿从互联网整理的庞大文本数据库中的语言统计模式来生成回答。2023年1月末,ChatGPT已经拥有1亿月活跃用户,成为迄今为止增长速度最快的消费级应用。
- 2023年2月7日,微软宣布支持ChatGPT的技术整合到最新版本的必应搜索引擎和Edge浏览器中。3月,OpenAI宣布推出插件功能,赋予ChatGPT使用工具、联网、运行计算的能力。
《发展历史》
- OpenAI公司由山姆·阿尔特曼(Sam Altman)等人在2015年成立于旧金山,该公司致力于开发人工智能和自然语言工具,在2019年获得微软投资10亿美元。2020年6月,OpenAI推出了其首个NLP语言模型GPT-3 (Generative Pre-Trained Transformer 3),并在其网站上以API(应用程序编程接口)的形式提供模型供外部使用。[13]同年,OpenAI推出了微调版本GPT-3.5,2022年1月又推出了GPT-3.5的预微调版本InstructGPT,但并未向公众发布。[14]
- 2022年11月30日,OpenAI发布了基于GPT-3.5的聊天机器人模型ChatGPT,这款聊天机器人的智能化水平远超同类产品。仅在上线5天后,ChatGPT便吸引了超过100万的用户数量。[2][6][15]
- 2023年1月末,ChatGPT已经拥有1亿月活跃用户,成为迄今为止增长速度最快的消费级应用。[9][10] 随后在2月初,由于满负荷运行,ChatGPT官网宣布暂时无法为所有用户提供访问服务。[16] 2023年2月7日,微软宣布将ChatGPT技术整合到最新版本的必应搜索引擎和Edge浏览器中。[11]
- 2023年3月,英伟达推出全新的GPU推理平台,为ChatGPT提供了10倍的加速性能。[17] 3月14日,OpenAI发布了GPT-4模型,并将其整合到ChatGPT Plus高级服务中。[18] 高级服务的用户可以享受到更快的响应速度、优先访问新功能以及在高峰时段的访问权。[19] 每月20美元的ChatGPT Plus服务让用户可以体验到基于GPT-4的ChatGPT版本。[20]
- 此外,OpenAI还于2023年3月为软件开发人员提供了ChatGPT和Whisper模型API,使得开发人员可以为自己的应用程序添加AI语言处理和语音识别功能。[21] ChatGPT API的价格为每1000个代币(约750个单词)0.002美元,比GPT-3模型便宜10倍。[22]
- 在安全方面,2023年3月,一个漏洞导致部分用户可以看到其他用户的对话标题,但OpenAI CEO Sam Altman表示用户无法看到对话内容。[23][24] 在问题解决后,用户无法查看到自己的对话历史记录。[25] 随后的报道显示,漏洞比最初认为的要严重得多,导致泄露了用户的姓名、邮箱地址、支付地址、信用卡号的后四位和信用卡的过期日期等信息。[26][27]
- 2023年5月,人工智能开发机构OpenAI在美国发布了适用于iPhone的免费ChatGPT应用程序,其中包括通过其Whisper AI语音识别模型提供的语音输入支持,App还可以与网页版AI助手同步聊天记录。这是ChatGPT首次推出官方移动客户端应用程序。
《实现原理》
- ChatGPT是InstructGPT的兄弟版本[29],与它的前代模型GPT-3相比,ChatGPT将基于人类反馈的强化学习(RLHF)纳入到训练过程之中,以便让模型输出更好地贴近用户提问的意图[29]。人类反馈强化学习是ChatGPT和InstructGPT实现与人类意图对齐,即按照人类指令尽可能生成无负面影响结果的重要技术[30]。
- GPT-3是一个由OpenAI开发的数学模型,也是ChatGPT得以发展起来的基础[31],其基本原理与GPT-1和GPT-2类似,都是通过预测下一个词的训练方式进行特定的大量训练,模型可以从句子的前面的一个词来预测下一个词。但GPT-3使用了远大于GPT-1和GPT-2的训练数据量以及模型参数量来增强模型效果,GPT-3具有96层Transformer Decoder Layer,每一层有96个128维的注意力头,单词嵌入的维度达到了12288,使用到的数据集规模达到了45TB。[30]训练后GPT-3可以根据训练结果对于给定的词语进行自动填充,选择概率最高的词输出,或者对下一个词采样输出。当向GPT-3提问时,其可以根据提问词选择最有可能的下一个词,并将其附加到输入结果中,反复迭代,直到答案生成完毕。[30]
- GPT-3只能对问题作出看似合理的回答,不能理解问题语义以及针对用户问题生成符合用户需求的答案,偶尔会产生无用或者错误的输出[31]。在训练InstructGPT和GPT-3.5时,OpenAI为了解决这个问题,选择人工撰写一定数量的问答对,由标注人员自己写问题和答案,同时人工回答外部用户的问题,进行有监督微调(SFT),来训练原始的GPT-3,使其生成更好的答案。但是受到人工撰写成本高昂的影响,于是OpenAI选择让模型一次生成多个答案,由人类按照有用程度进行排名,总共使用了33000多个问题及其答案,设定了一定的奖励机制,训练了一个新的奖励模型,为每个问题及答案组合进行打分,人类不参与创造答案,只参与排名,同时收集了31000多个外部用户提问,使用奖励模型评分,进一步对模型进行有监督微调,并反复迭代,即“人类反馈强化学习”。[32]
- ChatGPT便是从经过人类反馈强化学习训练后的GPT-3.5的一个版本微调而来,在InstructGPT训练的基础上,采用对话形式进行进一步强化训练,由标注人员继续进行排名,利用奖励模型不断微调,最终得到比InstructGPT更强的模型。[29]
- 到了GPT-4,输入形式更进一步,不限于文本,输入可以是图片、表格等不同形式的内容,输出可以实现以图编程,据图写作等应用。通过文本和图像之间的比对学习,建立文本到图片的特殊映射关系。同时,支持了长文本输入,单词量比ChatGPT扩展了8倍。[33]ChatGPT 4完成并通过了前代ChatGPT 3.5没能过关的四大会计行业执业资格考试,包括注册会计师(CPA)、注册管理会计师(CMA)、注册内部审计师(CIA)和注册税务师(EA),平均得分85.1。
《功能与现状》
- ChatGPT的功能比较简单,采用一问一答的方式。由用户提出问题,ChatGPT给出答案。[7]ChatGPT的学习能力比以往的人工智能产品更强,能够回答人类提出的各种高难度、复杂的问题。[1]ChatGPT参加了美国高校的入学资格考试(SAT)并取得中等学生水平的成绩,使用《老友记》主角的口吻创作了剧本对白,给出了消除经济不平等的六点计划,[1]甚至还为以色列总统艾萨克·赫尔佐格(Isaac Herzog)撰写了部分公开演讲内容。[35]
- OpenAI宣称ChatGPT的局限主要体现在以下几个方面:
- ChatGPT有时会写出听起来有道理但不正确或无意义的回答。解决这个问题仍具有挑战性,因为:在强化学习训练期间,目前缺乏正确信息的来源;为了将模型训练得更谨慎,它会拒绝回答本可以正确回答的问题;监督训练会误导模型,因为理想的答案取决于模型所知道的信息,而不是人类所知道的信息。[29]
- ChatGPT对输入措辞的微调或多次尝试同一提问非常敏感。例如,使用一种措辞给出一个问题,模型可能会声称不知道答案,但轻微修改表述后,模型就能正确回答。[29]
- 模型常常会过度过度使用某些短语,导致语句冗长,例如反复重申它是由OpenAI训练的语言模型。这些问题源于训练数据中的偏见(训练者认为长答案看起来更详尽)和过度优化问题。[29]
- 理想情况下,当用户提供模棱两可的查询时,模型会询问用户,澄清问题。然而现有模型常常会猜测用户的意图。[29]
- 虽然OpenAI期望让模型拒绝不当请求,但它有时会响应有害的指令或表现出偏见。OpenAI使用Moderation API来警告或阻止某些类型的不安全内容,但仍会有一些假阳性和假阴性。[29]
- 另据媒体报道,截至2023年2月,ChatGPT难以进行高级逻辑处理,在完成“多准快全”的基本资料梳理和内容整合后,并不能提供综合判断、修改调整、逻辑完善等“画龙点睛”之笔。在时效性方面,用于ChatGPT语言模型训练的数据为2021年9月前的数据,因此在一些最新的数据和事件方面可能会存在滞后,这也可能造成ChatGPT在内容准确性和知识性上存在一定短板。[36]2023年3月OpenAI推出插件功能后,ChatGPT获得联网能力,解决了时效性问题。
《影响与争议》
- ChatGPT在人工智能领域产生了轰动性效应,一度催使AIGC[a]概念股猛涨,[6][8]投资机构普遍看好ChatGPT和AIGC赛道的商业前景。[9]与此同时,它还对教育和学术领域的传统模式提出了挑战。[8]为了防止学术欺诈和剽窃,巴黎政治学院、香港大学等高校宣布禁止师生在教学活动中使用ChatGPT等基于AI的工具,[37][38]《科学》《自然》《肿瘤学》等多家科学期刊亦发表声明称,不接受论文将ChatGPT列为“合著者”。[8]
- 此外,ChatGPT未经授权获取总计约320TB文字信息的预训练方式已引发争议和不满,推特(Twitter)首席执行官埃隆·马斯克就公开宣布,叫停ChatGPT访问Twitter数据库来获取训练数据,声称“需要更多了解OpenAI的治理结构和未来收入计划”。[36]欧盟负责内部市场的委员蒂埃里·布雷东也于2023年2月公开发表评论称,ChatGPT一类的人工智能技术可能为商业和民生带来巨大的机遇,但同时也伴随着风险,因此欧盟考虑设立规章制度,以规范其使用,确保向用户提供高质量、有价值的信息和数据。[5]当地时间2023年3月24日,OpenAI发布声明,向用户和整个ChatGPT社区道歉,表示将重建信任。声明表示,当周早些时候,该公司将ChatGPT下线,原因是开源库中存在一个漏洞,致使一些用户可以看到另一用户的聊天记录标题。该漏洞已被修复。[39]3月31日,意大利数据保护机构对OpenAI公司非法收集用户信息展开调查,并宣布,即日起禁止使用聊天机器人ChatGPT,并限制开发这一平台的美国人工智能公司OpenAI处理意大利用户信息。[40]意大利采取措施后,欧洲数据保护委员会宣布成立专门工作组,以促进该调查在欧洲地区的合作事宜。随后,法国国家信息自由委员会和西班牙国家数据保护局针对ChatGPT可能的违反法律行为启动调查程序。