阅读本文大约需要5分钟
大家好,我是恩哥。
最近几天,刷屏朋友圈的只有两件事:ChatGPT横空出世,以及如何买药预防新冠。
恩哥第一时间体验了几天ChatGPT,总结下来就一句话:这个AI的聊天能力已经足以在很多知识领域达到专业水平!
1秒生成一篇短小精悍的发言稿!惊不惊艳?!
再来构造一个模拟沙盒世界试试:
厉不厉害?再稍微微调一下,完全可以包装成一个付费的游戏陪聊机器人服务了!
但是,一个很多人忽视的事实,是它其实也经常会一本正经的胡说八道!而且极具误导性!
下面就让我们来看几个真实的例子:
首先我问ChatGPT,什么是『勾三股四弦五』,其实就是勾股定理的一个特例。结果他一本正经的胡说,什么手上事情很多,什么手忙脚乱,简直不要太自信!
再看一个例子:
我问ChatGPT怎么评价创建了联想的雷军,结果AI一本正经的回答说他的各种事迹。
关键ChatGPT胡说的时候还特别自信!你要没点识别能力,真的可能在他各种惊艳的多轮对话中默认它的回答都特别正确!
本质上,作为一个基于超大规模模型训练出来的出色AI,ChatGPT仍然有NLP常见的局限性,例如它不会因果推断,不懂逻辑,可以说"有能力,没灵魂"。
那么他的自我纠错能力怎样呢?让我们看看告诉他创立联想的是柳传志,而不是雷军之后,它对同一个问题的反应:
看到这,恩哥要抓狂了!根本没学会啊!认错态度很好,但是不会知错就改!
其实,ChatGPT最核心的技术之一,就是RLHF,也就是Reinforcement Learning from Human Feedback(基于人类反馈的强化学习)的简称。
OpenAI之所以要免费开放ChatGPT给大众使用,核心目的之一,是为了收集更多用户的反馈信息,来更好的修正那些错误的答案,不断帮ChatGPT变得更好!结果因为它出色的聊天能力,短短几天之内达到100w注册用户。
from 林惠⽂@真格基⾦
恩哥发现,前天问ChatGPT的时候,它一本正经胡说的那个答案,过了一天之后就已经被修正了,相信这就是很多用户的反馈帮它对真正正确的答案进行了排序修正的结果。
现在,我们离马斯克说的对人类非常危险的强人工智能又近了一步,你觉得是的好消息还是坏消息?😄
参考文献
-
ChatGPT-真格基金分享.pdf
-
chat.openai.com
-
注册ChatGPT全教程:https://mirror.xyz/0x6E12A28086548B11dfcc20c75440E0B3c10721f5/9O9CSqyKDj4BKUIil7NC1Sa1LJM-3hsPqaeW_QjfFBc
与你一起 终身成长
/ END /
公众号:Ntech恩钛客(ID:entaike)
恩哥,恩钛客主笔人,工作15年,做过独角兽公司CTO,当过亿级业务操盘手,分享职场、创业、管理、技术、投资、产品、销售、商业等领域(是的,有点多😄)的一点感悟,想一直写到2099年,期待与你一起,终身成长:)