真不是凡尔赛!ChatGPT如此成功,OpenAI也不理解

7bca198825ee3ada5b4157071d49d290.jpeg


  视学算法报道  

编辑:Aeneas Britta

【导读】ChatGPT的爆火,是OpenAI完全没有想到的是。现在,对于自家模型的人气和种种问题,他们还在慢慢适应中……

这家公司做出了或许能引爆第四次工业革命的产品,但他们却百思不得其解:为啥自家的产品能这么火?

就,真的不是凡尔赛。

1b46a4cb39d0d9c006b838a6e73209bb.png

最近,MIT Technology Review采访了ChatGPT的几位开发者,让我们近距离地了解了这个大爆的AI产品背后的故事。

火成这样,没有丝毫防备

当OpenAI在202211月下旬悄无声息地推出ChatGPT时,这家初创公司并没有报多大的期望。

OpenAI的员工也没想过,自家模型即将走上的,是一条属于顶流的爆红之路。

5f2be9f218ad98c36a56642053de8042.jpeg

ChatGPT仿佛在一夜间大红大紫,还引发了关于大语言模型的一场全球淘金热,而OpenAI还没有丝毫准备,只能匆忙地赶上自己顶流模型的脚步,试图抓住商机。

在OpenAI从事政策工作的Sandhini Agarwal说,在OpenAI内部,ChatGPT一直被视为「研究预览」——它是一个两年前技术的更完善的版本,更重要的是,公司试图通过公众的反馈,来消除模型的一些缺陷。

谁能想到,这样一个「预览」产品,阴差阳错出道后就爆红了呢。

对此,OpenAI的科学家很懵逼,对于外界的鲜花和掌声,他们也很清醒。

「我们不想把它夸大为一个巨大的基础性进步,」参与研发ChatGPT的OpenAI科学家Liam Fedus说。

01c5472a1e36387f5a964b9b98db9d02.png

ChatGPT团队成员当中,有5位被评为2023年度 AI 2000 全球人工智能学者

为此,MIT Technology Review的记者Will Douglas Heaven采访了OpenAI的联合创始人John Schulman、开发者Agarwal和Fedus、对齐团队的负责人Jan Leike。

ChatGPT为什么这么火,我们自己都不明白

创始人John Schulman表示,ChatGPT发布后几天,他时不时就会刷推特。有那么一段疯狂的时期,推特信息流中全是ChatGPT的截图。

他想到了这是一个对用户很直观的产品,也想到它会有一些粉丝,但没想到它会变得这么主流。

Jan Leike表示,一切都太突然了,所有人都很惊讶,努力地跟上ChatGPT爆火的节奏。他很好奇,到底是什么在推动它的人气飙升,难道有什么幕后推手?毕竟,OpenAI自己都搞不清为什么ChatGPT能这么火。

b5d6f5c9a2fb9c8654d5e012822c043c.png

Liam Fedus解释了他们如此惊讶的原因,因为ChatGPT并不是第一个通用的聊天机器人,此前就已经有很多人尝试过了,所以Liam Fedus觉得他们的机会并不大。不过,私人测试版也给了他信心——或许,这款A是用户们真心会喜欢的东西。

Sandhini Agarwal总结道,对所有人来说,ChatGPT一炮而红都是个惊喜。此前,大家在这些模型上做了太多的工作了,以至于都忘记了对于公司外部的普罗大众来说,它是这么惊人。

的确,ChatGPT内的大部分技术并不新鲜。它是GPT-3.5的一个微调版本,而在ChatGPT几个月前,OpenAI就发布了GPT-3.5。而GPT-3.5本身就是GPT-3的更新版本,GPT-3出现于2020年。

849c0c79f0db276ca61bbfac18708d31.png

ChatGPT团队参与此前七大技术研发人数

在网站上,OpenAI以应用编程接口或API的形式提供了这些模型,其他开发者可以很轻易地将模型插入自己的代码中。

在2022年1月,OpenAI还发布了GPT-3.5的前一个微调版本InstructGPT。只不过,这些技术没有向公众推介罢了。

微调过程

根据Liam Fedus的介绍,ChatGPT模型是由与InstructGPT相同的语言模型微调而来的,使用的微调方法类似。研究人员增加了一些对话数据,并对训练过程进行了一些调整。所以他们不想把它夸大为一个巨大的基础性进步。

事实证明,对ChatGPT起了大作用的,是对话数据。

根据标准基准的评估,实际上两个模型之间的原始技术能力并没有很大差别,ChatGPT最大的不同是,更容易获得和使用。

Jan Leike解释说,在某种意义上,可以把ChatGPT理解为OpenAI已有一段时间的AI系统的一个版本。ChatGPT的能力并没有更强。在ChatGPT问世之前,同样的基本模型已经在API上使用了将近一年时间。

5f2b2768f125318d2aa9e5adbd31c134.png

而研究者们的改进可以概括为,在某种意义上,让它更符合人类想用它做什么。它会在对话中和用户交谈,是一个聊天界面,很容易访问。它更容易推断出意图,而用户可以通过来回试探,来达到自己想要的目的。

秘诀就是,人类反馈强化学习(RLHF)技术,这和InstructGPT的训练方式很像——教会它人类用户实际喜欢的样子。

Jan Leike介绍说,他们让一大群人阅读了ChatGPT的提示和回应,然后对回应进行二选一的选择,看看大家认为哪个回应更好。然后,所有这些数据都被合并到一次训练中。

033a6479c5f327beeffb12ee66b40cd7.png

它的大部分内容与他们在InstructGPT上所做的是一样的。比如你希望它有帮助的,希望它是真实的,希望它不会恶毒。

另外还有一些细节,比如如果用户的询问不清楚,它应该问后续的问题去细化。它还应该澄清,自己是一个人工智能系统,不应该承担它没有的身份,不应该声称拥有它不具备的能力。当用户要求它做它不该做的任务时,它必须明确拒绝。

也就是有一个清单,列出了人类评分员必须对模型进行排名的各种标准,比如真实性。但他们也会偏爱某些做法,比如AI不要假装自己是人。

准备发布

总的来说,ChatGPT用的都是OpenAI已经使用过的技术,所以团队在准备向公众发布这个模型时,没有做任何特别的事情。在他们看来,为以前的模型设定的标准已经足够了,GPT-3.5已经足够安全。

而在ChatGPT对人类偏好的训练中,它自学了拒绝行为,拒绝了很多请求。

OpenAI为ChatGPT组建了一些 「唱红脸的」人:公司里的每个人都坐下来,试图打破这个模型。也有外部团体做同样的事情。值得信赖的早期用户也会提供反馈。

Sandhini Agarwal介绍道,他们确实发现了它会产生某些不需要的输出,但这些都是GPT-3.5也产生的东西。因此,只看风险的话,作为一个「研究预览」,ChatGPT已经够好了。

John Schulman也表示,不可能等到一个系统100%完美了,才去发布它。几个月来,他们对早期版本进行了beta测试,beta测试人员对ChatGPT的印象很好。

OpenAI最担心的,其实是事实性的问题,因为ChatGPT太喜欢捏造东西了。但是这些问题在InstructGPT和其他大型语言模型中都存在,所以在研究者们看来,只要ChatGPT在事实性和其他安全问题上比那些模型更好,就已经足够了。

而根据有限的评估,在发布之前,可以确认ChatGPT比其他模型更真实,更安全,因此,OpenAI决定继续发布。

发布后的反馈

ChatGPT发布后,OpenAI一直在观察用户是如何使用它的。

一个大型语言模型被放在数以千万计的用户手中,这种事还是史上第一次。

用户们也玩疯了,想测试ChatGPT的极限在哪里,bug在哪里。

69a14362e407695af194d59dafb0aa5d.png

当然,问题很多,比如ChatGPT给黑客们大开方便之门,帮忙窃取信用卡号的恶意软件代码,OpenAI也在针对这些问题不断改进。

ChaatGPT的走红,也让许多问题涌现出来,比如偏见问题,比如黑客通过prompt诱导的问题。

Jan Leike表示,某些在推特上疯传的东西,其实OpenAI已经有人悄悄出手了。

比如越狱问题,绝对是他们需要解决的。用户就是喜欢尝试通过一些弯弯绕绕让模型说不好的话,这在OpenAI的意料之内,也是一条必经之路。

当发现越狱时,OpenAI会把这些情况添加到训练和测试数据中,所有数据都会被纳入未来的模型。

3e1667234b448d1145ae0324cb616f22.png

Jan Leike表示,每当有一个更好的模型,他们都会想把它拿出来测试。

他们非常乐观地认为,一些有针对性的对抗性训练,可以使越狱的情况得到很大的改善。虽然目前还不清楚这些问题是否会完全消失,但他们认为,自己可以使很多越狱行为变得困难。

当一个系统「正式出道」时,很难预见到所有实际会发生的事情。

因此,他们只能把重点放在监测人们使用该系统的目的上,看看会发生什么,然后对此作出反应。

148d99e8da7266b99b44346c0070f59b.png

如今,微软已经推出了必应Chat,很多人认为它是OpenAI官方未宣布的GPT-4的一个版本。

在这个前提下,Sandhini Agarwal表示,现在他们面临的赌注,肯定比六个月前高得多,但仍然低于一年后的水平。

这些模型是在什么背景下被使用的,有极其重要的意义。

对于谷歌和微软这样的大公司,即使有一件事不符合事实,也会成为巨大的问题,因为他们本身就是搜索引擎。

61d474b657b25c580a375a8bd5f958bf.png

谷歌的第23位员工、创建了Gmail的Paul Buchheit,对谷歌持悲观态度

作为搜索引擎的大语言模型,和一个只为了好玩的聊天机器人是完全不同的。OpenAI的研究者们也在努力弄清楚,如何在不同用途之间游走,创造出真正对用户有用的东西。

John Schulman承认,OpenAI低估了人们对于ChatGPT政治问题的关心程度。为此,在收集训练数据时,他们希望做出一些更好的决定,来减少这方面的问题。

Jan Leike表示,从自己的角度来看,ChatGPT经常出现失败。有太多问题需要解决了,但OpenAI并没有解决。这一点,他坦诚地承认。

尽管语言模型已经存在了一段时间,但仍然处于早期。

接下来,OpenAI需要做的事情,就更多了。

参考资料:

https://futurism.com/the-byte/openai-confused-people-impressed-chatgpt

https://www.technologyreview.com/2023/03/03/1069311/inside-story-oral-history-how-chatgpt-built-openai/

7825e8de2a93dc43c3be90693d8d7009.png

outside_default.png

点个在看 paper不断!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/3429.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【记录】ChatGPT|近期三次更新一览(更新至2023年2月3日)

如果你还没有使用过ChatGPT,可以先看看我的上一篇文章:【记录】ChatGPT|使用技巧与应用推荐(更新至2023年2月8日)。   1月11号晚上,ChatGPT突然很多人都无法登录,包括我。我当时以为是它的服务…

解决openai网站拒绝访问的问题,Access denied,You do not have access to chat.openai.com

解决步骤: 清除浏览器的历史纪录数据尝试更换科学上网节点开启无痕浏览模式 我通过这三个步骤登录成功了,希望可以帮助到大家!

复旦大学邱锡鹏团队发布类 ChatGPT 模型MOSS

不知道这个人工智能,有没有获得完整的一生。 ChatGPT 是最先进的 AI,也是最热门的应用 —— 自去年 11 月底发布以来,它的月活跃用户两个月超过一亿,轻松拿到了全球互联网史上用户增长速度的第一。 它也是一种门槛很高的技术。由…

面向Java开发者的ChatGPT提示词工程(2)

在这篇博客文章中,我将分享一些关于提示词的关键原则,帮助你在使用语言模型时获得更好的结果。具体来说,我将介绍两个关键原则,帮助你编写有效的提示词。同时,我也鼓励你在阅读文章的过程中运行代码,亲自体…

【ChatGPT】如何修复access denied you do not have access to chat.openai.com

文章目录 一、前言二、是什么导致 ChatGPT 访问被拒绝错误?三、如何修复 OpenAI 上的访问被拒绝?3.1 清除 Cookies 和缓存3.2 检查账户登录凭证3.3 允许请求的权限3.4 从其他浏览器登录OpenAI3.5 联系 OpenAI 客户支持 四、ChatGPT 支持的国家和地区 一、…

chat GPT Access denied解决方法

chat GPT Access denied解决方法 由于大量的用户涌入,Chatgpt的服务器不堪重负,openai应该是设置了相关的验证条件,导致了部分用户被拒绝。 进入chatgpt的时候出现下图提示,证明网络环境出了问题,切换成为全局代里后就…

基于Chatbot UI 实现ChatGPT对话-V1.0

基于Chatbot UI 实现ChatGPT对话-V1.0 前端基于开源项目:chatbot-ui进行二次开发,感兴趣的小伙伴可以自行研究。 本项目搭建初衷:在无法科学上网的情况下,实现ChatGPT对话。还有规避官方聊天时,长时间无链接导致的问题…

前沿重器[31] | 理性聊聊ChatGPT

前沿重器 栏目主要给大家分享各种大厂、顶会的论文和分享,从中抽取关键精华的部分和大家分享,和大家一起把握前沿技术。具体介绍:仓颉专项:飞机大炮我都会,利器心法我还有。(算起来,专项启动已经…

好文转载 基于chatgpt开发QQ机器人

格言:自立才能自主,靠人更须靠己。有志之人立长志,无志之人常立志。千里之行,始于足下;艰难困苦,玉汝于成。少壮不努力,老大徒伤悲。✊✊✊ 📫 如果您觉得文章里有错误的地方&#x…

chatgpt赋能python:Python访问QQ:实现跨平台即时通讯的利器

Python 访问 QQ:实现跨平台即时通讯的利器 介绍 QQ是目前国内最广泛使用的即时通讯软件之一,其强大的功能和用户群体优势使其成为了广大网民沟通交流的首选工具。但是,由于QQ使用了闭源协议,因此无法对其进行深度的二次开发&…

观点丨Fortinet谈ChatGPT火爆引发的网络安全行业剧变

FortiGuard报告安全趋势明确指出“网络攻击者已经开始尝试AI手段”,ChatGPT的火爆之际的猜测、探索和事实正在成为这一论断的佐证。攻守之道在AI元素的加持下也在悄然发生剧变。Fortinet认为在攻击者利用ChatGPT等AI手段进行攻击的无数可能性的本质,其实…

ChatGPT火出圈,英语老师如何用起来?

原文:ChatGPT火出圈,英语老师如何用起来? 人工智能对话聊天机器人ChatGPT从去年11月底推出后就在社交媒体上走红,到今天注册人数已经超过了一亿。 小编想,最近许多朋友的生活中,可能也是或多或少都被 Chat…

ChatGPT火爆来袭,携手参与为开源助力

前言: Hello大家好,我是Dream 。最近语言模型ChatGPT在网络上一阵大火,ChatGPT 以惊人的速度问世,在技术圈中引起了广泛讨论。在 GitHub 上近期还诞生了多个 ChatGPT 相关的开源项目,数量之多令人瞠目结舌,…

Python 第一难保,要看 ChatGPT 火不火?TIOBE 6 月榜单发布!

整理 | 郑丽媛 出品 | CSDN(ID:CSDNnews) 本周,6 月 TIOBE 编程语言排行榜已更新,一起来看看这个月各大编程语言有何最新变化吧! Python 会保持第一吗? 编程语言的流行度,除却易用性…

ChatGPT火爆科研圈,登上《Nature》《Science》正刊

ChatGPT火出圈了,几乎涉及到各行各业的每个领域,科研圈更甚。 《Science》期刊主编H. HOLDEN THORP发表关于ChatGPT的社论: “ChatGPT is fun, but not an author”。 “ChatGPT 很好玩,但不是作者” 文章指出,许多担忧…

ChatGPT 火爆,程序员会不会被取代?答案都在这里!

作者 | 王启隆、唐小引 出品 | CSDN(ID:CSDNnews) “技术日新月异,人类生活方式正在快速转变,这一切给人类历史带来了一系列不可思议的奇点。我们曾经熟悉的一切,都开始变得陌生。” ——约翰 冯 诺依曼&…

ChatGPT 火爆,最全 prompt 工程指南登 GitHub 热榜,标星 4.7k!

转自 | 新智元 编辑 | 好困 Aeneas 如何才能让大规模语言模型输出自己想要的结果?现在,一本超全超详提示工程指南来了,GitHub已标星4.7k。 提示工程,可以说是玩转ChatGPT、DALLE 2等等这类AI模型的「必修课」。 但这个「提示」&am…

生成式 AI:百度“文心一言”对标 ChatGPT?什么技术趋势促使 ChatGPT 火爆全网?

文章目录 前言一、生成式 AI 的发展和现状1.1、什么是生成式 AI?1.2、生成式 AI 的发展趋势1.3、AI 生成内容的业务场景和分类 二、生成式 AI 从分析领域到创作领域2.1、 降低内容创作门槛,增加 UGC 用户群体2.2、提升创作及反馈效率,铺垫线上…

Fortinet谈ChatGPT火爆引发的网络安全行业剧变

FortiGuard报告安全趋势明确指出“网络攻击者已经开始尝试AI手段”,ChatGPT的火爆之际的猜测、探索和事实正在成为这一论断的佐证。攻守之道在AI元素的加持下也在悄然发生剧变。Fortinet认为在攻击者利用ChatGPT等AI手段进行攻击的无数可能性的本质,其实…

OpenAI chatGPT火爆出圈,世界悄悄发生着变化

OpenAI chatGPT火爆出圈,世界悄悄发生着变化 一、为什么突然火起来了?二、ChatGPT功能示例2.1 [AI聊天](https://chat.openai.com/chat)2.2 [AI写新闻稿](https://chat.openai.com/chat)2.3 [AI写代码](https://chat.openai.com/chat)2.4 [AI写论文](htt…