Trinkle回答:
有幸参与ChatGPT训练的全过程。直接上想法:
RLHF会改变现在的research现状,个人认为一些很promising的方向:在LM上重新走一遍RL的路;如何更高效去训练RM和RL policy;写一个highly optimized RLHF library来取代我的tianshou(x
dataset的质量、多样性和pretrain在RLHF的比重很重要
dialog是一个完备的载体,能够包含任何东西
有人专门跟我说openai是下一个google
可以开始想象AGI之后的世界了,我已经想了几个月了。比如最简单的想法是,这些model能够提供廉价的代码生产力,虽然不是100% perfect,但是可以极大地促进单个程序员的生产效率,因此科技公司的scope可以成倍的变大,比如之前需要一个team现在可能只需要一个人+一个model,那么相同数量的员工的话生产力会是之前的数倍
我们没有借鉴之前搞dialog agent的工作思路(其实是没了解…),如果有好的idea的话欢迎评论区留言
机器之心推送评论区第一位说内测了好几个月的人是我女票(狗头
电光幻影炼金术回答:
在简单尝试之后,我激动地发现,ChatGPT是人类人工智能历史上的重要一步,见证历史了我们属于是。
ChatGPT宣布了,人工智能的对话模型开始能在大范围、细粒度问题上给出普遍稳妥的答案,简单地说,人工智能的大对话模型可以达到基本不犯错误的水平了(这么说可能不严谨,但是对于普通老百姓这样理解就可以了)。
话不多说,直接上效果:
(知道很多人是来看段子的,所以段子优先。)
更新:
问怎么求解台湾问题:
帮我安慰女朋友(这个例子为转载,已经得到同意):
AI学英文:
1、代替特朗普给普京写情书:
自动翻译的结果:
2、帮我写份周报应付老板:
3、问怎么找男朋友:
虽然看上去是非常普通的回答,但是这种安全与谨慎正是代表了ChatGPT的水平:在它不知道的问题上,他会果断拒绝回答。这也标志着,人工智能的对话模型开始走向真的安全稳定的应用。
4、问我的科研方向如何?
大模型分析道,NeRF(神经渲染场)是一个比较新颖的方向,同时存在着广阔的探索空间。
那么我们再看看一些对领域的评价:
5、问问顶会论文怎么发,帮我找找新的idea。
对话模型给出了注意力机制等论文密码,还给了一个方向:视频对象检测跟踪(这个方向确实不错hh)。
6、帮我解决一些调参的难题:
有特别有趣的问题可以发在评论区,我帮你问AI。
内容转载自知乎,著作权归属原作者,侵删
分享
收藏
点赞
在看