羿阁 发自 凹非寺
量子位 | 公众号 QbitAI
一款新的聊天AI被网友们玩疯了。
能直接生成代码、会自动修复bug、在线问诊、模仿莎士比亚风格写作……各种话题都能hold住,它就是OpenAI刚刚推出的——ChatGPT。
有脑洞大开的网友甚至用它来设计游戏:先用ChatGPT生成游戏设定,再用Midjourney出图,简直是AI生产力一条龙了。
有人还将ChatGPT的回复与谷歌搜索结果对比,惊讶地发现ChatGPT在实用性上强太多:谷歌这是要凉啊。
甚至有人预言如果谷歌不做出改变很快就会被淘汰,到时候自己愿意每月花15-20美元使用ChatGPT。
不过好消息是,目前ChatGPT正处于免费试用阶段,有条件的小伙伴可以赶紧试试。(链接放在文末)
ChatGPT有多神奇?
有网友分别问谷歌和ChatGPT“如何使用Latex表示微分结果”,相较于谷歌中规中矩的回答:
ChatGPT则是一下给出了直接可用的代码,你只需动动手复制粘贴即可:
还有人让ChatGPT给出冒泡排序的最坏时间复杂度,并且要求它用“19世纪40年代黑帮电影中讲话很快的聪明人”口吻说出来,也被ChatGPT轻松拿捏:
直接问下面代码的bug是啥,ChatGPT也能给你说得明明白白:
除了计算机,ChatGPT在其他领域表现也很出色,比如它还能AI在线问诊。
当你告诉它自己得了皮疹,并且呼吸困难,感觉很虚弱时,ChatGPT会像医生一样为你分析病因,并建议你比起吃药,更需要戒烟、多锻炼。
与搜索引擎里需要小心分辨的医疗广告对比,可以说很贴心了。
还有许多机智的网友,像上文提到的那样,用ChatGPT来搞设计。
比如这位网友让ChatGPT给自己设计卧室,然后用它给出的文字做提示词,去MidJourney生成图像,连请设计公司的钱都省了。
那么,介绍了这么多,ChatGPT背后原理究竟是什么?
背后原理
顾名思义,ChatGPT是在GPT-3.5系列中的一个模型上进行微调而成,该系列已在2022年初完成了训练。
它以对话方式进行交互,既能够做到回答问题,也能承认错误、质疑不正确的前提以及拒绝不恰当的请求。
与OpenAI今年初发布的InstructGPT一样,ChatGPT也是使用强化学习进行训练,但在数据收集设置上有所区别。
在模型训练中,OpenAI使用监督微调:训练者提供对话样本,扮演对话的双方,即用户和AI助手。
除此之外,训练者还可以访问模型编写的建议,帮助他们撰写答案。
为了创建强化学习的奖励模型,研究团队需要收集比较数据,为此,他们随机选择模型编写的信息,对替代结果进行抽样,再让训练者对样本进行排名。
通过上述的奖励模型和近端策略优化对模型进行微调,并执行了此过程的多次迭代,最后得出了该模型。
不过别看它在许多方面表现都很出色,研究人员也承认现阶段ChatGPT还存在一些bug。
举个例子,有网友在多次尝试后就指出,ChatGPT经常会过度使用某些短语,比如反复重申“自己是由OpenAI训练的语言模型”。
除此之外,有时候ChatGPT的回答过于冗长,甚至当网友告诉它自己需要更短一点的回答时,它反而说的更多了。
还有理性的网友指出,ChatGPT想要替代谷歌也没那么容易。
一位在Alphabet工作的网友就现身说法,谷歌也不是没有考虑过在搜索引擎中引用大模型,但最大的问题是成本太高了。
如果要对用户收费的话,价格很可能高达150~200美元每月,恐怕没有几个人愿意支付这笔钱。
不过,OpenAI的CEO萨姆·阿尔特曼(Sam Altman)对ChatGPT的未来发展表示很有信心:
他表示,语言接口将是未来的一个发展方向,而ChatGPT就是为大家先打了个样,相信很快大家就能用上能跟自己聊天、回答问题并提供建议的AI助手了。
话说回来,你还想到了ChatGPT哪些好玩的用途?
有条件的小伙伴赶紧戳下面链接试试吧~
指路链接:
https://chat.openai.com/
参考链接:
[1]https://twitter.com/sama/status/1598038818472759297
[2]https://news.ycombinator.com/item?id=33817682
[3]https://twitter.com/jdjkelly/status/1598021488795586561
— 完 —
一键三连「分享」、「点赞」和「在看」
科技前沿进展日日相见 ~