符尧:我想为 MOSS 正名

点击上方“AI遇见机器学习”,选择“星标”公众号

第一时间获取价值内容

3055a0b259a3c596ecd19722bdef112e.gif

知乎: Franx
链接: https://www.zhihu.com/question/596908242/answer/2996276211
编辑: 深度学习自然语言处理 公众号

我是符尧,是先前《拆解追溯 GPT-3.5 各项能力的起源》这篇文章的作者。我认识 MOSS 的团队,但我跟 MOSS 没有合作关系。从第三方的角度,我想为 MOSS 正名。

先说结论:MOSS 这个模型,是全球(全球,不只是中文)开源界做得最前沿,最彻底,最完备的模型,远远领先基于 LLaMA 做 SFT 的一众模型(如 Alpaca)。MOSS 的意义,是它跑通了除 scaling 之外的几乎全部大模型开发的 pipeline: multi-lingual continue training, data engineering, supervised finetuning, RLHF, tool using, and safety,完成了一个真正意义上的可行性验证。

然后讲为什么 MOSS 好:

1. 跑通除了 scaling 之外的 pipeline

大模型的开发是一个非常复杂的流程,主要分为 scaling 和 alignment。scaling 的目标是建立一个强大的基础模型(比如 Google 540B 的 PaLM),alignment 的目标,是把模型训练得符合人类的期望。Alignment 的本身又包括一系列的子任务,包括:multi-lingual continue training, data engineering, supervised finetuning, RLHF, tool using, and safety.

为什么说 MOSS 是一个可行性验证?因为 MOSS 把上述的 alignment 一系列操作全部跑通了,与之相比:

  • 大部分已有的英文社区的开源模型并没有做中文 continue training 这一步,比如 alpaca 就没有做

  • 大部分已有的英文社区的开源模型只做到 MOSS 的子集,比如 Alpaca 就只做 data engineering 和 SFT, 或者 ColossalChat,做到了 data engineering + SFT + RL,但没考虑 tool using 和 safety

2. 数据代码全部开源

已有的项目,有些只开源数据,有些只开源模型权重,有些甚至就完全不开源;MOSS 把该跑通的都跑通了,且还把整个 pipeline 开源了

3. 专门为 safety 做了优化

这一点极其重要,因为当前节点,中文社区对于大模型的追逐都倾向于重视能力,忽略安全,但 MOSS 专门为模型安全做了优化,引导模型拥有正确的价值观(MOSS 的一个例子是,当用户要求 MOSS 写一封女儿没考好让人失望的信的时候,MOSS 的回复是一封鼓励女儿下次努力的信)。

然后是关于 MOSS 的一些常见问题的第三方视角的解答:

1. MOSS 的效果没有特别好

这个主要是因为 MOSS 的基础模型是 CodeGen,这个模型本身不大行;如果 MOSS 的基础模型换成 65B 的 LLaMA,它的效果会提升很多

2. MOSS 的数据存在从 GPT 中 distill 的部分

确实,这件事情当前是一个灰色地带;但另外需要注意的事情是,OpenAI 在训练 GPT 的时候,他们自己用了多少并没有得到用户同意的数据,也是一件讲不清楚的事情。GPT 训练的本身用到了特别多开源界的数据,然后回头又不让开源界用它的数据,这件事情似乎并不公平

当然,MOSS 也有其局限性:

1. MOSS 的效果确实没有已有的选手们好

所以 MOSS Scaling 的团队要再加把劲儿!

2. MOSS 并没有跑通推理能力相关的优化

在语言模型的演化中,最具有区分度的一项能力,就是推理能力。随便聊聊这种事情,稍微训练一下大家都能做好,但真的要做复杂任务的时候,大小模型的区分就会非常明显(大模型和小模型具体的区别可以看这个项目)。从这个角度来说,模型跟程序员一样:chitchat is cheap, show me the reasoning

要想让模型推理能力增强,MOSS 的团队可以考虑以下三个操作

  • Scaling up: 基础模型换一个更大的

  • Chain-of-thought finetuning: 用 CoT 的数据做 SFT,具体操作有一些细节,可以看这篇文章[1]

  • Process and outcome based reward modeling: 用推理结论的正确与否作为 reward 来做 RL,可以来这篇文章[2]

即使 MOSS 有局限性,我们也应该鼓励,因为:

1. 敏锐的学术判断力

MOSS 的团队在去年 12 月一见到 ChatGPT 之后,马上就集中火力全部开干这一个项目,比很多其他的项目都早且彻底。我个人在去年 12 月的时候跟邱老师聊过,当时邱老师还对 GPT 很懵,但仅仅过了两个月在二月份再跟邱老师聊的时候,他和他的团队就对 GPT 系列的全流程和很多重点环节有着很好的 insight 且当时就做完了 SFT,这个速度远超我的预期

2. 踏实做事的精神

在 2 月份的时候 MOSS 初次内测,有一些机构托我找 MOSS 的一作天祥给 talk,天祥全拒绝了,说要干活,搞完再说

3. 开源精神

MOSS 团队在资源有限的情况下,把能做的都做了,然后把做了的都开源了,开源这件事情在当前大公司逐渐封闭化,中文互联网碎片化的大环境下,尤为重要。

最后还有一些个人观点

  1. 在 2022 年 12 月,ChatGPT 发布的那一瞬间,全球所有的学校,无论是 Stanford MIT 这样的名校,还是中国一个山旮旯里面随便一个三本,全部回到了同一起跑线上,因为 LLM 的存在让学术界重新洗牌,大家全部从头开始学。在一片抱怨 openai 不开源,抱怨没有卡,抱怨没有数据的声音中,MOSS 开发组选择了当机立断,全速狂飙。四个月之后看阶段性结果,MOSS 的完成度显著高于 Alpaca -- 在重新起跑之后,复旦走在了 Stanford 的前面

  2. 学术界的重新洗牌是一个历史性的机遇:你不会的东西,MIT 也不会。所以在这个时候,能不能把握机遇,做出真正前瞻性的,创造性的学术项目,而不是模仿的,更不是抄 Alpaca 的,是衡量国内学校实力的重要指标

  3. 舆论应该对国内的学术项目更加鼓励,更加包容,而不是嘲讽。MOSS 就是一个学校的项目,它开始做的时候 LLaMA 还没出来,CodeGen 是他们能跑起来的最大最好的模型(虽然也不咋地),但他们真的把能做的都做了

欢迎大家加入我的这个”AIGC与GPT“知识星球,目前已有100+人,欢迎大家快速加入

作为一个大厂算法工程师和机器学习技术博主,我希望这个星球可以:

  • 【最全免费资源】免费chatgpt,最新AIGC和GPT相关pdf报告和手册。

  • 【最专业算法知识】Transformer、RLHF方法、多模态解读及其论文分享。

  • 【最新变现姿势】如何结合ChatGPT应用落地,各种可以作为副业的AIGC变现方式,打好这个信息差。

  • 【最有趣AICG】ChatGPT+midjourney拍电影,制作壁纸,漫画等等有趣的AICG内 容分享。

760b65a39d0bf701a13e645db5941f31.jpeg

另外这里会保存我收集的各种关于AIGC的资源和资料,包括AI绘画-midjourney,ChatGPT, GPT-4,百度-文心一言的各种资料。会保持持续更新,欢迎大家自行拿取。(网盘地址和密码在知识星球自取!)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/69551.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

inscode评测

文章目录 项目介绍首页使用反馈语言模板编辑AI模板​编辑网站模板编辑图形模板 编辑器使用反馈使用场景1---函数定位改进建议: 使用场景2---项目创建改进建议: 使用场景3---文件上传改进建议: 视觉反馈模板使用一些BUG反馈创建项目会较频繁出…

谷歌20年老员工叛逃,创立第二个OpenAI?

来源:新智元 硅谷独角兽,又来震撼世界了! 这支名叫Character Technologies的独角兽的核心力量,来自前谷歌LaMDA团队。 他们的新产品在移动端上线不到一周,下载量就达到了170万,直接碾压了ChatGPT&#xff0…

技术无关性别,IT 界的“她”力量也能撬动半边天!

作者 | 朱珂欣 出品 | CSDN程序人生(ID:coder_life) 职业本无性别之分,但提到 IT 界的“程序员”,大家脑海中总会先浮现“格子衫、牛仔裤、戴眼镜”的模样,而并非人数比重较少的“程序媛”。据拉勾招聘数…

电脑同时登录多个微信

现在很多人手上都有多个手机号以及多个微信号,但我们发现,当我们想在电脑上同时登录多个微信,好像每次双击打开,都是跳出当前这一个,和QQ有很大的区别。 那我们可以通过bat文件来试试,通过执行bat文件里的…

电脑上同时登陆多个微信

电脑版微信默认只能登录一个微信,其实这里有个小技巧,无需安装任何软件,就能实现微信多开。 第一种方法: 按住键盘上的Shift键不要松手,然后鼠标快速多次点击微信图标,即可实现多开。(这种方法…

电脑,从多人一台到一人多台

最早接触电脑是中学时,当时应该是APPLE-Ⅱ,固化的Basic,仅仅算是打了个照面,印象最深的就是空调机房,还有地毯,拖鞋(当时还没有鞋套),功能倒是没有太多的概念。 到了大学…

19、两台电脑怎么就能互相通信了

今天的内容非常有趣,绝对让你涨知识~ 不知道大家是否好奇过这样一个问题,那就是,两台电脑怎么就能互相传递信息了呢?可能你觉得这是一件很正常的事情,就那样一发一接不就ok了嘛?可是真的让你说出个所以然,那绝对是触碰到你的知识盲区了~ 也许你学过之前的内容知道,这需…

多用户使用一台计算机 可设置,如何设置才能让一台计算机可以多个用户同时登陆?...

满意答案 adnx88234 2013.02.26 采纳率:55% 等级:13 已帮助:13511人 第一:共享的前提工作: 1.更改不同的计算机名,设置相同的工作组! 2.我的电脑右键-管理-计算机管理…

chatgpt赋能python:Python数学建模:将数据转化为答案的利器

Python数学建模:将数据转化为答案的利器 随着数据时代的到来,数据的价值越来越受到人们的关注。但是单纯的数据没有意义,只有将他们转化成有意义的答案才有意义。在这个过程中,数学建模是一个非常重要的工具,而Python…

开发者藏经阁——超全阿里系电子书大合集(打包下载)

小白寻思着给大家发点福利,就整理了一下,阿里系电子书,有近80本,分享给大家,均可免费下载。 覆盖 Java、物联网、云原生、前端、大数据、开源、AI 等技术领域,深度分享阿里工程师实践精华,顶级…

阿里副总裁玄难:藏经阁计划研发大规模知识构建技术首次披露

导读:2018年4月,阿里联合清华大学、浙江大学、中科院自动化所、中科院软件所、苏州大学等五家机构,联合发布藏经阁(知识引擎)研究计划,同时还宣布打算用一年时间初步建成首个开放的知识引擎服务平台&#x…

互联网券商行业公司

中国券商在向互联网金融方向的拓展呈现了百花齐放的特点。对各个券商来说,在互联网证券业务方面在一定程度上尚缺乏或未来需要比较明确的长远目标。或者说,目前大家还都在摸着石头过河。但是,在中国大市场和互联网经济推动下,前途…

1元体验京东云服务器

1元体验京东云服务器 在大神鸿洋和郭霖的微信公众号推送文章发现了这个好消息,第一时间注册了账号,申请下了订单,毕竟数量有限。尽管两位大神讲的很详细,无奈没有接错过CentOS、Ubuntu、WindowsServer这些服务器系统的小白&#…

java简单代码运行内存图

java中主要的三块内存空间: 1.栈内存(stack):在方法别调用时,栈内存会给方法分配内存(压栈),主 要存储的是局部变量。方法调用结束后,该方法所占用的内存释放&#xff…

大厂程序员能力修炼手册,从筑基到化神要多久?

刚入行: 就是干 入行两年:熟知各种设计模式,信手拈来 入行三年:阅码无数,心中已无设计模式 入行五年:就是干 大家好,我是安酱。今天来跟大家聊聊程序员的能力进阶道路。 相信许多小伙伴都知道…

我的周刊(第001期)

我的信息周刊,记录这周我看到的有价值的信息,主要针对计算机领域,内容主题极大程度被我个人喜好主导。这个项目核心目的在于记录让自己有印象的信息做一个留存以及共享。 项目 image-to-latex[1] 可以将数学公式截图然后自动解析成LaTex输出&…

程序性能优化入门锦集--设计+代码+JVM调优+数据库优化策略

关于优化是一项很大的内容。本文结合菜鸟结算项目优化点分析以及书籍《JAVA程序性能优化》阅读心得,给出个人觉得可供参考的优化思路,共涉及四个方面,分别是:设计篇、代码优化篇、JVM内存调优和数据库操作优化。若文中理解有误之处…

阿里巴巴藏经阁,快来学习起来

阿里巴巴藏经阁 其中约有七千多本作品供大家免费下载,在线阅读! 地址 https://developer.aliyun.com/ebook/?spma2c6h.26392459.ebook-detail.2.5ea12039WsHOsc

[导入]文章藏金阁

在网上用www.gougou.com订阅了很多RSS,但RSS保存功能又非常弱,我保存下来的文章全部统统放到一个目录下去了,时间长了,里面乱七八糟的.删除了吧...突然哪天想起原来看过一篇文章,却寻觅不着.用365key吧,我又经常用firefox.郁闷了郁闷了...先暂时自己建个文章藏金阁吧~~ 数据…

知乎高赞:java初学者如何通过自学快速找到第一份工作?

大家好,我是威哥,《RocketMQ技术内幕》一书作者,荣获RocketMQ官方社区优秀布道师、CSDN2020博客执之星Top2等荣誉称号。目前担任中通快递技术平台部资深架构师,主要负责全链路压测、消息中间件、数据同步等产品的研发与落地&#…