开源“模仿”ChatGPT,居然效果行?UC伯克利论文,劝退,还是前进?

7fd50ef431529e9368e8e9eedb95660c.png

原创:谭婧+ChatGPT

从“古”至今,AI的世界,是一个开源引领发展的世界。

虽然Stable Diffusion作为开源的图像生成模型,将图像生成提到了全新境界,但是ChatGPT的出现,似乎动摇了一些人的信念。

因为ChatGPT是闭源的,而它又是最先进的。

开源拥趸仰天长啸:

什么时候开源大模型(LLM)赶上ChatGPT?

这时,一个脑洞超大的高校研究团队用一篇学术论文严肃回答了相关问题:

“模仿ChatGPT大模型,到底行不行?”

30eb41e1b0204afde6627244641522c8.png

2023 年 5 月 25 日,美国加州大学伯克利分校的研究团队在国际开源论文网站arxiv提交了一篇学术论文。

论文题目为《The False Promise of Imitating Proprietary LLMs》。

我的翻译是《模仿语言大模型,谁为空头支票负责》。

本文中的英文单词imitating翻译为模仿,在这里是用小模型去学习ChatGPT的输出。不能翻译为“仿制”。

他们先提问:

开源LLMs大模型目前能力比不过闭源的,怎么办?

其次,拿出行动思路:

在最新的研究中,研究团队试图通过让开源语言模型模仿闭源语言模型(比如,ChatGPT),来提高开源大模型的能力。

于是,描述观察:

初步的结果看上去很好,模仿大模型在某些方面的能力与ChatGPT相当。然而,经过深入地分析发现,这些“模仿者”只模仿到表面,缺乏核心的能力。

第四,结论如下:

最有效的方式是,直面ChatGPT的挑战,从根本上提升开源模型的能力,而非简单地模仿。

历史反复证明,学术论文又证明,科研没有近路可抄,唯有脚踏实地,埋头苦干。

论文讲完啦。

f0a911b4d176c57a7925ac2bf35e2ddc.png

谭老师我秉持“AI只会淘汰不会使用AI的人”的理念,公布一下本文幕后学术顾问是ChatGPT。

我和它简单对话,它给予了我极大的,有偿AI学术支持,我内心那叫一个感谢:

首先,Ctrl+C

把论文《The False Promise of Imitating Proprietary LLMs》的摘要一键粘贴。

其次,它翻

“一种新兴的方法可以廉价地改进较弱的语言模型,那就是在更强大的模型的输出上进行微调。这种方法旨在使用较弱的开源模型廉价地模仿专有模型的能力。在这项工作中,我们对这种方法进行了严谨的分析。

“我们首先微调了一系列模仿ChatGPT的语言模型,这些模型有不同的基础模型大小(15亿--130亿),数据来源,以及模仿数据量(0.3M--150M tokens)。然后,我们使用群众评估者和权威的NLP基准对模型进行评估。”

“最初,我们对模仿模型的输出质量感到惊讶--它们在遵循指令上似乎更加出色,群众工人将它们的输出评价为可以与ChatGPT竞争。然而,当进行更有针对性的自动评估时,我们发现在模仿数据不大的任务上,模仿模型几乎没有缩小基础语言模型与ChatGPT的差距。

“我们证明,这些性能差异可能会被人类评估者忽视,因为模仿模型擅长模仿ChatGPT的风格,但不是其事实性。总的来说,我们得出的结论是,模型模仿是一种虚假的承诺:存在着开源和闭源语言模型之间的显著能力差距,目前的方法只能通过使用大量的模仿数据或更有能力的基础语言模型来弥补。因此,我们认为,提高开源模型的最高杠杆行动是面对开发更好的基础语言模型的困难挑战,而不是采取模仿专有系统的捷径。”

8d97bbf7c9ee5f154a9da815e0bbc525.png

学术人与普通人的悲喜并不相通,我只觉得啰嗦,作为一名尊贵的付费用户,我放下矜持,直白地说:

“可以把上面的这段学术性的文字讲得更加通俗易懂一些,做为一个公众号可以发表的那种水平吗?”

ChatGPT回答我:

在新的研究方法中,人们发现一种用更小的投资提高语言模型质量的方法。简单说,就是把较弱的语言模型,如开源的,让它学习较强的语言模型的输出,例如ChatGPT。这就好比让开源模型成为专有模型的“影子”,模仿它的行为。

我们对这种方法进行了深入的研究。我们试了一系列的模型,让它们模仿ChatGPT。这些模型有各种各样的大小,来源和模仿数据的数量。

然后我们通过众包和NLP的基准测试,对这些模型进行了评价。

一开始,我们对模仿模型的结果感到惊奇。它们更好地遵循了指令,就像是ChatGPT的克隆版。

然而,当我们用更严格的测试方法,我们发现,在模仿数据不够多的任务上,这些模仿模型并没有达到ChatGPT的效果。

我们发现,这种差距是因为模仿模型只是模仿了ChatGPT的外表,而没有模仿到它的核心。就像人类,我们能模仿一个人的动作和声音,但不能模仿他的思维。

因此,我们认为,只依赖模仿是没有用的。开源和专有的语言模型之间有明显的能力差距,我们不能只通过大量的模仿数据或者更大的基础模型来弥补这个差距。

我们认为,最好的方法是面对挑战,开发更好的基础模型,而不是走捷径,只模仿专有的系统。

7a8f52df8c80be1163852abc92c65a7d.png

是时候让ChatGPT知道什么叫做不厌其烦了。

于是,我说:

请再进一步缩短一下,缩短到3-4句话的样子?

ChatGPT回答:

在最新的研究中,我们试图通过让开源语言模型模仿专有模型(例如ChatGPT)来提高其能力。

初步结果看上去很好,仿制模型在某些方面与ChatGPT相当。

但深入分析发现,这些模仿模型只模仿到了表面,缺乏核心能力。因此,我们认为最有效的方式是直面挑战,从根本上提升开源模型能力,而非简单地模仿。

c799771e4cc263699f7a564c2261b5eb.png

1e4187c697434c87aef421871b80cdd5.png

人工智能很酷,而我觉得自己一点都不酷,日后若是都这样写稿了,扪心自问,我的价值在哪?

好吧,是时候展示真正的技术了(体现我的价值了)。

我分别与美国硅谷、国内某厂的两位顶尖AI科学家聊完之后,了解到这样一些情况。

我国国内也有大模型研发团队采用模仿的方法造大模型,也就是这篇学术论文中所谈到的“模仿”。

具体方法包括,以开源的GPT作为基础模型,也就是以此为基础构架,然后疯狂问ChatGPT提问,以此输出的数据,再输入国产大模型。

在攀登“人类最高智能软件产品”的艰难道路上,这样做到底行不行?

大模型正处在研究前沿的风暴中,学术观点交锋激烈。

美国加州大学伯克利分校作为人工智能研究的前沿阵地,同一所大学,两支不同的研究团队所持观点截然相反。

如前文所示,《The False Promise of Imitating Proprietary LLMs》这篇论文团队不认可这种方法。

而另一支团队,也就是知名开源大模型小羊驼(Vicuna)背后的研究团队却认可这种方法。

433ff6a7daebb4386666a04b755db71c.png

虽然这一学术争论的“战火”虽然还没有燃烧到国内,但是双方分歧已经非常清晰了。

“模仿”就是投机取巧?

不,这是一个学术争论,不能草率下结论。

解疑释结,尚需时日。

-结束-

23cb83a35c275c7548fe35e254533174.jpeg

更多阅读

AI框架系列:

1.搞深度学习框架的那帮人,不是疯子,就是骗子(一)

2.搞AI框架那帮人丨燎原火,贾扬清(二)

3.搞 AI 框架那帮人(三):狂热的 AlphaFold 和沉默的中国科学家

4.搞 AI 框架那帮人(四):AI 框架前传,大数据系统往事

注:(三)和(四)现在并未公开发表,将会以图书出版的形式与各位见面。

漫画系列

1. 解读硅谷风投A16Z“50强”数据公司榜单

2. AI算法是兄弟,AI运维不是兄弟吗?

3. 大数据的社交牛逼症是怎么得的?

4. AI for Science这事,到底“科学不科学”?

5. 想帮数学家,AI算老几? 

6. 给王心凌打Call的,原来是神奇的智能湖仓

7. 原来,知识图谱是“找关系”的摇钱树?

8. 为什么图计算能正面硬刚黑色产业薅羊毛?

9. AutoML:攒钱买个“调参侠机器人”?

10. AutoML:你爱吃的火锅底料,是机器人自动进货

11. 强化学习:人工智能下象棋,走一步,能看几步?

12. 时序数据库:好险,差一点没挤进工业制造的高端局

13. 主动学习:人工智能居然被PUA了?

14. 云计算Serverless:一支穿云箭,千军万马来相见

15. 数据中心网络:数据还有5纳秒抵达战场

16. 迟到不可怕,可怕的是别人都没迟到, 数据中心网络“卷”AI:

17. 是喜,还是悲?AI竟帮我们把Office破活干完了

AI大模型与ChatGPT系列:

18. ChatGPT大火,如何成立一家AIGC公司,然后搞钱?

19. ChatGPT:绝不欺负文科生

20. ChatGPT触类旁通的学习能力如何而来? 

21. 独家丨从大神Alex Smola与李沐离职AWS创业融资顺利,回看ChatGPT大模型时代“底层武器”演进

22. 独家丨前美团联合创始人王慧文“正在收购”国产AI框架OneFlow,光年之外欲添新大将

23. ChatGPT大模型用于刑侦破案只能是虚构故事吗?

24. 大模型“云上经济”之权力游戏

25. 深聊丨第四范式陈雨强:如何用AI大模型打开万亿规模传统软件市场?

26. 云从科技从容大模型:大模型和AI平台什么关系?为什么造行业大模型?

27. 深聊何晓东:一场九年前的“出发”:奠基多模态,逐鹿大模型


6fe215d2fe11e3d965e137f250c0b80c.jpeg

d41bc6dafbd9899d3fcd2c6e1475a08f.png

最后,再介绍一下主编自己吧,

我是谭婧,科技和科普题材作者。

为了在时代中发现故事,

我围追科技大神,堵截科技公司。

偶尔写小说,画漫画。

生命短暂,不走捷径。

原创不易,多谢转发

还想看我的文章,就关注“亲爱的数据”

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/14971.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

没有这些,别妄谈做ChatGPT了

文|卖萌酱 转自 | 夕小瑶的卖萌屋 ChatGPT破圈爆火后,越来越多人开始问: “啥时候出现中国版的ChatGPT?” 国内学术界和工业界,都纷纷躁动起来——百度、阿里、字节等大厂纷纷喊口号,一众创业公司也开始争做…

2023年中国AI芯片行业市场现状及未来发展趋势预测

2023年AI芯片报告汇总了60家国产AI芯片厂商,大致按如下应用类别进行归类:云端加速、智能驾驶、智能安防、智能家居、智能穿戴、其它AIoT。对于每一家筛选的公司,我们从主要产品、核心技术、应用场景、市场竞争力、发展里程碑等方面对公司进行…

ChatGPT Plugins引发AI行业“洗牌”,与元宇宙双向奔赴

三月迎来AIGC新品爆发大热潮,据不完全统计,在两周内GPT-4、微软Microsoft 365 Copilot、Midjourney V5、Google PaLM API、英伟达新显卡接连出场,创新工场CEO李开复、美团联合创始人王慧文、阿里副总裁贾扬清、搜狗创始人王小川等纷纷进军&am…

ChatGPT Plugins内幕、源码及案例实战(二)

第6章 ChatGPT Plugins内幕、源码及案例实战 检索插件的API需要以下环境变量才能工作,如表6-2所示。 ChatGPT检索插件示例中,“.well-known”目录里面的ai-plugin.json是一个插件的说明文档,插件名为Retrieval Plugin,用于搜索用户的文档(如文件、电子邮件等),该插件…

ChatGPT Plugins内幕、源码及案例实战(三)

ChatGPT Plugins内幕、源码及案例实战(三) ChatGPT Plugins内幕、源码及案例实战 6.4 ChatGPT Retrieval Plugin全流程内幕解析 以ChatGPT检索插件为例,我们讲解一下它整个的流程,让大家有一个比较明确、清晰的统一认知:  数据存储:设立的前提是你有文档,会有一些文…

ChatGPT Plugins内幕、源码及案例实战

ChatGPT Plugins内幕、源码及案例实战 6.1 ChatGPT Plugins的工作原理 本节主要跟大家谈ChatGPT的插件(Plugins),这个内容非常重要。现在很多企业级的开发,一般都会基于ChatGPT插件进行一些服务的封装,相当于开发了一个…

各大平台仅存的优势就只剩下数据了,OpenAI推出ChatGPT Plugins

部分结论 *本文2300字左右 各大平台仅存的优势就只剩下数据了AI as a service会加速行业迭代平台App会继续裁员...其实OpenAI一开始就是冲着开发者去的... 现象 我们首先说一下事件,再讲一下笔者看到的其他背后的东西。 2023年(北京时间)3月2…

ChatGPT-Plugins-Searchable

ChatGPT Plus 用户应该都知道Plus已经开放了插件功能,但是在插件商店里存在一个较大的问题插件数量超过100款,却没有便捷的搜索功能。 而我们在查找一款插件时,需要从插件商店的第一页点击到最后一页一个个找,显然这非常的麻烦。 …

ChatGPT plugins GitHub Copilot X【附申请链接】

省流总结 ChatGPT 插件系统 插件意味着无限可能,各种应用场景。 ChatGPT 发布插件系统,补齐所有短板 ChatGPT 插件系统是一项新功能,它使语言模型能够与外部工具和服务进行交互,提供对信息的访问并实现安全、受约束的操作。它由…

ChatGPT Plugins的开源解决方案

近期,来自清华大学、中国人民大学、北京邮电大学、UIUC、NYU、CMU 等高校的研究人员联合 OpenBMB 开源社区、知乎、面壁智能公司探索了基础模型调用外部工具的课题,联合发表了一篇 74 页的基础模型工具学习综述论文,并发布了开源工具学习平台。 该团队提出了基础模型工具学…

ChatGPT Plugins内幕、源码及案例实战(一)

ChatGPT Plugins内幕、源码及案例实战 6.1 ChatGPT Plugins的工作原理 本节主要跟大家谈ChatGPT的插件(Plugins),这个内容非常重要。现在很多企业级的开发,一般都会基于ChatGPT 插件进行一些服务的封装,相当于开发了一个代理(Agent),把一些服务或者API封装在里面,然后…

chatgpt赋能python:PythonUDS:让你的汽车掌握更多技能

Python UDS:让你的汽车掌握更多技能 UDS(Unified Diagnostic Services)是一种汽车电子控制单元(ECU)通信协议,用于车辆的诊断和测试。Python UDS是用Python编程语言实现的UDS客户端和服务器实现&#xff0…

ChatGPT技术链

一切都要从 ChatGPT 的横空出世说起...... 曾经一片祥和的 NLP 社区,被这个突如其来的 “怪物” 吓到了!一夜之间,整个 NLP 圈发生了巨大的变化,工业界迅速跟进,资本 “狂飙”,开始了复刻 ChatGPT 之路&am…

当ChatGPT-4遇到移动开发

3月15日,#GPT4做一个网站只要十秒#登上热搜。 当地时间周二(3月14日),人工智能研究公司OpenAI公布了其大型语言模型的最新版本——GPT-4。 几乎所有的办公室案头工作,GPT-4无所不能。比如,10秒钟就能做出…

对于Android程序员的选择方向、ChatGPT真有你需要的答案

前言 今年似乎没有开春的温暖,去年的严寒蔓延到了现在,不知道会持续多久。 正因为这样还有不少Android开发在等待着,我也不清楚这些人还在等待着什么,像极了一个不撞南墙不知道疼的“小孩”。 今天打开搜索引擎映入眼帘的还是去…

开源类似chatGPT项目ChatGLM-6B单显卡安装运行成功

项目git地址 https://github.com/THUDM/ChatGLM-6B 配置要求: 本机电脑显卡显存6G以上。只有cpu则需要32GB以上。 安装基础环境 1.安装python 3.10版本 https://www.python.org/ftp/python/3.10.10/python-3.10.10-amd64.exe 2.安装cuda(有显卡) 下载页面 https://d…

Make sure that the latest NVIDIA driver is installed and running.

背景: MMdetection环境配置激活好之后,在训练数据集的时候发现提示显存不足,于是怀疑服务器上跑的有别的项目在利用显卡。为了验证这个设想,于是重启了ubuntu服务器,等服务器重新启动后,发现显卡加速不能用…

英伟达NVIDIA服务器显卡多实例技术(MIG)

❤️觉得内容不错的话,欢迎点赞收藏加关注😊😊😊,后续会继续输入更多优质内容❤️ 👉有问题欢迎大家加关注私戳或者评论(包括但不限于NLP算法相关,linux学习相关,读研读博…

英伟达发布ChatGPT专用GPU,性能提升10倍,还推出云服务,普通企业也能训练LLM...

文|Pine 发自 凹非寺 源|量子位 “AI的iPhone时刻已至”,英伟达或成最大赢家。 在GTC2023大会上,黄仁勋接连放出大招: 不仅发布了ChatGPT专用GPU,比之前就能实时处理ChatGPT的HGX A100快了10倍;…

在Windows平台监视英伟达(Nvidia)显卡性能

深度学习训练时,常常需要监视显卡性能情况。在Linux/Ubuntu平台命令行输入nvidia-smi就可以监测显卡性能。 在Windows平台要稍微复杂一些。 先要找到显卡驱动安装位置。我的是C:\Program Files\NVIDIA Corporation\NVSMI。 文件夹中有一个nvidia-smi.exe。 利用命令…