最强对话模型 ChatGPT 向 Google 搜索发起挑战

b5ede2c9cd3813240bef9520821c1c7f.png

GPT-3 发布的两年后,我们没等来它的亲弟弟 GPT-4,而是在今天亲眼见证了 OpenAI 带来了一种全新的 AI 聊天机器人——ChatGPT,也可以称之为是 GPT-3 家族里面的亲戚,它不仅可以解释代码、编写情景喜剧脚本,也可以为用户的查询提供对话式回答,而且回答几乎能够满足网友的”小心思“。

目前,ChatGPT 处于测试阶段(chat.openai.com),只要有 OpenAI 账户就可以免费使用。万万没想到,此超级对话模型一经开放,很多人便深陷其中,无法自拔。就连 OpenAI 背后的投资者马斯克不忘调侃一句,”很多人疯狂地陷入了 ChatGPT 循环中。“

183442de0e4b6a546b59114200de10bd.png

1、ChatGPT 的背后

对此,我们不禁好奇,ChatGPT 到底有什么样的魔力,吸引这么多人去尝试?它与 GPT-3 又有什么不同之处?

根据 OpenAI 官方介绍,与 GPT-3 最大的不同应该就是 ChatGPT 提供了一个用户友好的对话界面,并且非常有道德,即可以强烈限制一些有害的输出,如暴力、脏话等不当的请求。

ChatGPT 是 InstructGPT 的兄弟模型,它被训练为在提示中遵循指令并提供详细的响应。

之前了解过 OpenAI 的工程师们,想必对  InstructGPT 还有印象。今年年初,OpenAI 为了好好调教 GPT-3,便给它带来了”调教师“—— InstructGPT,它采用了”从人类反馈中强化学习“(RLHF)来训练这个模型,可以让彼时的 GPT-3 输出的更为准确。

最新的 ChatGPT 使用的方法与 InstructGPT 相同,也是使用了 RLHF,有些不同的地方主要体现在数据收集设置上。

对此,OpenAI解释道,”ChatGPT 使用监督微调训练了一个初始模型:人类 AI 培训师提供对话,他们在对话中扮演双方--用户和 AI 助手。AI培训师通过由模型生成的建议,以帮助 AI 不断调整回复的内容。“

当然,为了创建一个用于强化学习的奖励模型,OpenAI 也需要收集比较数据,其中包括两个或更多按质量排名的模型回复。为了收集这些数据,OpenAI 收集了 AI 培训师与聊天机器人的对话,并随机选择了一个模型编写的消息,抽查了几个备选的回复,再让 AI 培训师对这些回复进行排名。此外,利用这些奖励模型,这项研究使用近似策略优化算法对模型进行微调,并对这个过程进行了多次迭代。

761db108f0bb5cf18d5d605bb6572fa6.png

根据官方介绍,ChatGPT 是对 GPT-3.5 系列中的一个模型微调而成,该模型在 2022 年初完成了训练。值得注意的是,ChatGPT 和 GPT-3.5 是在 Azure AI 超级计算基础设施上训练的。

2、百态横生的 ChatGPT,玩出新花样

到目前为止,很多人对 ChatGPT 进行了各种测试,发现了各种潜在的用途。比如说:

它可以是程序员得力小助手,帮助开发者解决编码问题:

f41270f0e2484ba5d2c7785f6ed67172.png

就像这样:

c123d308e4f89dc68c00d60cd6991187.png

甚至还能解释冒泡排序算法:

56b5a8d7f161e6456a7b75582541f7b8.png

它也是很好的调试小伙伴,程序员再也不用害怕 Debug 了?

2becd28a1d077a641fd07bf51c745c4b.png

它也能充当诗人。当问及”能否写一首关于埃隆-马斯克接管 Twitter 的押韵诗?“时,它能流畅自然地分享道(不知大家能打几分):

埃隆·马斯克现在至高无上

在 Twitter,他是终极国王

他拇指一弹就发推文

他的追随者想要屈服

充满想法和计划的头脑

他总是大步前进

......

447e0aa6366be11778f4b3e230ffe347.png

对艺术家也有一定的启发:

7d2d3fb5f77fd7cc9c62950ea2e2845d.png

还能进入影视圈,写写剧情脚本:

1a700bbe217935ac552c9c951c4859e9.png

另外,它也能”一本正经“地解释各种科学概念,比如说”热力学“:

08cee98e9eec8b78d7a6907151928ad2.png

甚至它还能写一篇学术论文。当然在学术圈的论文上面,还是不建议大家使用的,或许接下来 ChatGPT 也会成为高校老师们颇为头疼的产品工具。

7b948adb8eb22a3ba32b9e8543431098.png

除此之外,根据 OpenAI 分享的官方示例中,其表示还能为日常提供一些实质性的建议。

用户:帮我写一封简短的说明,向我的邻居介绍自己。

ChatGPT:

你好呀,

我的名字是 [你的名字],我刚搬到隔壁。我想伸出手来介绍自己。我期待着认识你和附近的人。如果您有任何需要或只是想聊天,请随时过来或给我打电话。

最好的, [你的名字]

用户:你能让它更正式吗?

ChatGPT:

亲爱的邻居,

我写信是为了自我介绍。我的名字是 [你的名字],我最近搬到了隔壁。我想花点时间伸出手打个招呼。我期待着结识您和附近地区。

如果有什么我可以做的好邻居,或者如果您有任何需要,请随时告诉我。我很乐意尽我所能提供帮助。

此致,[你的名字]

用户:你能帮我寄吗?

ChatGPT:

很抱歉,我是一个基于文本的 AI 助手,没有能力为您发送一封实体信件。我只能提供关于写什么的建议和建议。您可以接受该建议并自己发送这封信。

可以说上知天文下知地理,前能写代码,后能编剧本,ChatGPT 比 GPT-3 强得不止这些。

3、局限性与挑战

当然,现实来看,ChatGPT 毕竟依然是由人训练出来的,其虽然智能,但也依然避不开一些无厘头以及错误。

在 Twitter 上,当计算生物学教授CarlBergstrom要求 ChatGPT 写一篇关于他生活的维基百科条目时,ChatGPT沉着冷静地做到了这一点,但不妨碍它写的内容里面包含了几个完全虚假的传记细节。

e68246baae475fda8f870d7c880931f9.png a5a97cb97c8784f42b110dc376c2e964.png

针对这种错误,OpenAI 也在官方公告中强调,当前的 ChatGPT 存在一定的局限性,其直言「想要完全解决这个问题是非常有挑战性的」,因为:

(1) 在 RL 训练期间,目前没有真实世界的数据来源;

(2) 模型被训练得更加谨慎,导致它拒绝回答它可以正确回答的问题;

(3) 监督训练误导了模型,因为理想的答案取决于模型知道什么,而不是人类演示者知道什么。

ChatGPT 对输入措辞的调整或多次尝试同一”提示“很敏感。例如,给定一个问题的措辞,模型可以声称不知道答案,但只要对问题的措辞稍加修改,它就可以给出正确回答。

该模型的回答内容往往过分啰嗦,并过度使用某些短语。例如重申它是由 OpenAI 训练的语言模型。这些问题来自于训练数据的偏差(训练者更喜欢看起来更全面的长篇答案)和众所周知的过度优化问题。

理想情况下,当用户提供了一个模棱两可的问题时,模型会提出质疑。然而与之相反的现实是,如今的模型往往会猜测用户的意图。

对此,OpenAi 解释称,「虽然我们已经努力使模型拒绝不适当的请求,但它有时会对有害的指令作出回应或给出有偏见的回答。我们正在使用 Moderation  API 来警告或阻止某些类型的不安全内容,但我们预计它目前不一定会立即见效。因此,我们渴望收集用户的反馈,以帮助我们正在进行的工作,改善这个系统。」

4、将向 Google 搜索发起挑战?

尽管如此,不可否认的是,ChatGPT 的输出质量似乎比之前 GPT-3 模型有了显著的改进,而且回答的内容覆盖多维度,甚至在一定程度上,可以直面”搜索引擎“与”问答社区“。

为此,也有网友将 Google 和 ChatGPT 进行了对比:

1e1b0786bf4ae2db105d7358b12f709a.png

其分别在 Google 搜索和 ChatGPT 中提出了同一个问题:

a918d0fd39ada0a0718f7c6442aba27f.png ec4cce4f9b0f7fa9da2b1cdd2fd0ecba.png

几番比对下来,这位网友表示,Google 的搜索结果都可以不用贴上来了,因为这些问题在它的平台上没有什么好的结果。与此同时,其附上了来自 ChatGPT 详细的结果。

48d73becac1f3f00b18bea1463a1cb6f.png

虽然对于这样的结果,来自 Google 母公司 Alphabet 的一位工程师 @hncel 解释道:

我在 Alphabet 工作,最近我去参加了一个内部技术讲座,是关于在谷歌部署这样的大型语言模型。作为免责声明,我首先要说明这不是我的专业领域,我只是参加了这个技术讲座,因为它听起来很有趣。

像 GPT 这样的大型语言模型是谷歌在 ML 维度主要研究的领域之一,而且有大量相当明显的应用,它们可以被用来回答查询、索引信息等。

在谷歌,有一个巨大的预算,用于配备人员来研究这些类型的模型并进行实际的训练,这非常昂贵,因为需要大量的计算能力来训练这些超级巨大的语言模型。然而,我从讲座中了解到,在谷歌最大的产品(如搜索、Gmail)中实际使用这些语言模型的经济性还不太成熟。放置一个演示,让感兴趣的人们玩玩是一回事,但如果考虑到服务成本、增加的延迟以及像谷歌搜索本身收入已经接近无限小的事实,试图将它深入地整合到一个每天提供数十亿次请求的系统中是另一回事。我想我记得演讲者说过这样的话:在将这样的模型整合到搜索等产品中之前,他们至少要将成本降低 10 倍。

在未来几年,10 倍甚至 100 倍的改进显然是一个可实现的目标,所以我认为这样的技术将在未来几年出现。

就现下而言,ChatGPT 的出现,是否会在未来短短几年内吸引大量使用 Google 搜索这类工具的开发者、创作者、设计者们,或许还需要看看 ChatGPT 正式上线之后的效果,我们也将拭目以待。

5、参考:

  1. https://openai.com/blog/chatgpt/

  2. https://news.ycombinator.com/item?id=33817682

  3. https://www.theverge.com/23488017/openai-chatbot-chatgpt-ai-examples-web-demo

  4. 原文:https://mp.weixin.qq.com/s/Yr-8HSVFQj26X-n75cyKvw

  5. https://www.engraved.blog/building-a-virtual-machine-inside/


随手关注或者”在看“,诚挚感谢!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/38148.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Google 新一代音乐识别

文 / Google AI 苏黎世办公室 James Lyon 2017 年,我们发布了具有闻曲知音功能的 Pixel 2,就是利用深度神经网络为移动设备带来低功耗、始终开启的音乐识别功能。在开发 “闻曲知音” 时,我们的目标是打造一个小巧高效的音乐识别器&#xff0…

谷歌AudioLM :通过歌曲片段生成后续的音乐

AudioLM 是 Google 的新模型,能够生成与提示风格相同的音乐。该模型还能够生成复杂的声音,例如钢琴音乐或人的对话。结果是它似乎与原版没有区别,这是十分让人惊讶的。 为什么生成音乐如此困难? 创作音乐并不是一件容易的事。生成音频信号&…

“程序员交友网站” SO 突然裁员 10%,网友:ChatGPT 出来后就不咋用了

在ChatGPT影响下,知名开发者问答社区Stack Overflow撑不住要裁员了! 随着用户大规模转战ChatGPT,Stack Overflow访问量大幅骤降,且盈利情况不容乐观。 CEO Prashanth Chandrasekar在公开信中坦言:正处于困难时期。 具…

巴比特 | 元宇宙每日必读:浙江发布2023年元宇宙产业发展工作要点,6月底前组建元宇宙产业联盟,年底打造20家“专精特新”企业...

摘要:据浙江省发改委官网 4 月 24 日消息,浙江省发改委等 5 部门近日联合印发《浙江省元宇宙产业发展 2023 年工作要点》。《工作要点》制定了十六项主要任务,并提出在2023 年 4 月底前建立元宇宙部门工作协同机制;6 月底前组建元…

免费版GPT-4!美国AI初创公司推出Forefront Chat,火到官网崩溃

免费版 GPT-4 到底香不香? AI初创企业正式推出Forefront Chat 近日,Forefront AI 正式推出 Forefront Chat,允许用户免费体验 GPT-4 的强大功能。ForeFront AI 是一家总部位于纽约的软件开发公司,联合创始人分别为 Jimmy Grease…

VTK笔记-生成MIP图像-vtkImageSlabReslice类

MIP MIP(Maximum/Minimum Intensity Projection),最大/最小密度投影重建。   MIP可以较真实地反应组织密度差异,使得血管的异常改变、形态、走形强化;但是只适用于外观形态的显示。   在容积扫描数据中对每条径线上…

重温马云英文演讲:最伟大的成功

“机会在哪呢?”每当创业者发出这个疑问,我们就该重温马云的这段英文演讲,让奋斗的热血重新沸腾起来。你有什么。你有年轻的身体,你有奇妙的想法,你有乐观的心态,你有无限的可能性! 演讲全文&am…

马云退隐前,在年会上说了最重要的三件事

作者:黄小斜 今天是9月10号教师节,也是马老师卸任阿里巴巴董事长的日子,同时也是阿里巴巴召开20周年年会的日子。有幸抽中了门票,在现场见证这具有历史意义的一幕,马老师在中场时给我们带来了一段演讲,也是…

阿里巴巴CTO独家自述:CTO就是要给CEO扫清障碍和风险

CTO可能不是思想家,但一定是行动派。 本文来自《云栖战略参考》第二期,过程中鲁肃非常坦率地探讨了一位合格CTO应该具备的素质,以及他自己一路摔打成长的心路历程。 一 我的经历 我的经历很简单,2004年之前一直在学校读书&#x…

马云现身西班牙度假 半年多来首次在境外露面

这半年里,马云公开露面的次数不到三次,就连前段时间的世界互联网大会也不见他的身影。 极少数出现在公众视野的马老师似乎在努力低调,但是他的一举一动仍然受人关注。 西班牙多家媒体10月19日报道,马云上周六飞抵西班牙, 在伊维…

【历史上的今天】8 月 22 日:改变世界的程序员们;网络直播的鼻祖;何小鹏离开阿里巴巴

整理 | 王启隆 透过「历史上的今天」,从过去看未来,从现在亦可以改变未来。 今天 2022 年 8 月 22 日。历史上的今天,Masatoshi Shima 出生,他和 英特尔(Intel) 合作设计的芯片让第一个微处理器 Intel 400…

马来西亚热情拥抱阿里巴巴 马云倡议的eWTP首次落地海外

摘要:3月22日,马来西亚总理纳吉布与阿里巴巴集团董事局主席马云一同出现在吉隆坡一场盛大启动仪式上,他们将共同见证马云的eWTP理念落地马来西亚。 3月22日,在邀请阿里巴巴集团董事局主席马云、阿里巴巴集团CEO张勇、蚂蚁金服集团…

基于GPT4All的大型语言模型设计生态系统

GPT4All 一套专为强大、定制的大型语言模型设计的生态系统,能够在消费级CPU上本地运行。在GPT4All中,所使用的模型是一个3GB至8GB的文件,读者可以自行下载该文件,并将其插入到GPT4All的开源生态系统软件中。这一软件生态系统由Nomic AI提供支持并进行维护,其目的是确保系统…

chatgpt赋能python:Python在数据可视化中的应用:如何用Python画图

Python在数据可视化中的应用:如何用Python画图 介绍 随着数据科学和人工智能的不断发展,数据可视化成为了一种重要的工具。通过绘制图表,我们可以更直观地理解数据之间的关系,并发现其中的规律和趋势。Python作为一种灵活的编程…

chatgpt赋能python:使用Python绘制散点图:了解基本语法,数据可视化。

使用Python绘制散点图:了解基本语法,数据可视化。 数据是任何研究的基石,因此对于从事各种数据处理工作的人员来说,数据可视化是一个非常重要的工具。Python作为一种非常受欢迎的编程语言,具有广泛的应用,…

chatgpt赋能Python-pythonpandas雷达图代码

前言 在数据可视化中,雷达图是一种非常常用的图表类型。Python中的pandas库提供了快速而简便的雷达图绘制方法,因此在本篇文章中,我们将着重介绍如何使用pandas库绘制雷达图,并提供一些有用的代码示例。 什么是雷达图&#xff1…

chatgpt赋能python:PythonSegno:一款专业的二维码生成器

Python Segno: 一款专业的二维码生成器 随着二维码的不断普及,二维码的应用场景也越来越广泛。比如在商品、广告等领域,我们经常可以看到精美的二维码。但数字出版、酒店、餐馆等行业也在使用二维码作为访问、付款等操作的工具。当然,对于开…

chatgpt赋能python:用Python绘制柱形图:一篇全面的指南

用Python绘制柱形图:一篇全面的指南 如果你想用数据去解决一些问题,或者向别人展示一些数据,那么绘制柱形图(Bar chart)就是一个好的选择。不仅因为它清晰、易懂,而且因为它是一种数据可视化的方式&#x…

chatgpt赋能python:Python方波绘制代码

Python方波绘制代码 Python是一种高级编程语言,已经被广泛应用于许多领域,包括数据科学、机器学习、Web应用程序开发等。在本文中,我们将介绍如何使用Python编写方波绘制代码。 什么是方波? 方波是一种周期性波形,具…

chatgpt赋能python:Python绘制动画:用代码让图像动起来

Python绘制动画:用代码让图像动起来 Python是一种强大的编程语言,可以用于各种应用领域,包括图形图像处理。利用Python的绘图库和动画库,可以快速、简便地实现动画效果。本文介绍Python绘制动画的基本概念与技巧,帮助…