基于 ChatGPT 的输出训练开源 LLM,糟透了!

8951a04fb5e90ecff646cba0ef4cdfa5.gif

【CSDN 编者按】曾以为在 ChatGPT 上训练模型是不错的捷径,可如今所有的大模型都依靠GPT来训练,所有这些内容都来自一个模型,越来越难以区分 LLM 生成的和真正有价值的内容。或许更多基于开源数据集的 LLM 才是我们所需要的。

作者 | Martin Laprise

译者|陈静琳   责编 | 屠敏

出品 | CSDN(ID:CSDNnews)

声明:本文由 CSDN 翻译,未经允许,禁止转载。

随着 ChatGPT 模型的发布和广泛应用,AI 市场中都在竞相创建开源替代方案来与 GPT-3.5/GPT-4 竞争,大多团队的一个常见捷径是在 ChatGPT 上微调他们的模型。我曾认为这样是一个不错的方式,而且完全公平。这样可以借助 OpenAI 有效地将整个网络提炼为他们的模型,包括使用所有公开访问的信息,除了服务条款的细小细节外,表面上看不出有什么重大的道德问题。

不过,直到现在,我意识到,即使忽略掉道德层面的问题,这样的做法本质上来说是错误的。

47b74b1595e2e94bcb14ea62af1486cb.png

技术维度看基于 ChatGPT 输出训练开源的 LLM

首先,从纯技术的角度来看,正如 Twitter 网友@yoavgo 近日发布的《Reinforcement Learning for Language Models》文章中解释的那样,没有 RLHF 组件就无法正确对齐 LLM。

监督学习只允许正反馈(我们向模型展示了一系列问题及其正确答案),而 RL 允许负反馈,监督学习模型只允许生成一个答案,所以对于这种类型的交互,我们必须使用 RL 训练。监督训练可能会教模型说谎,最核心的问题是我们希望鼓励模型根据其内部知识进行回答。训练的目标是让模型概括并学习回答任何问题,而不仅仅是指令训练数据中的问题,也希望模型具有普遍性。但是,如果成功地训练模型在这些情况下进行归纳,那么实际上是在教模型编造东西,它积极鼓励模型“说谎”,这是错误的。

e3ef23c88500b71e237ae00a91f4f9e7.png

所以从某种意义上说,说 OpenAI 的 LLM 只提取网络信息并不是完全正确的,因为它们在训练期间提供了大量的 RLHF 反馈,而这正是问题所在。

840c7575283d5a01fe5e3099e2b872e4.png

可怕的是,所有这些内容都来自一个模型

其次,再从一个美学、政治的角度来看待这一问题。最近,Midjourney 和 Stable Diffusion 工具生成的图像在互联网上呈现爆炸式增长,让我印象非常深刻,这些图像被用于博客文章、书籍插图、YouTube 缩略图、广告等地方。这改变了我们在过去 20 年中一直在到处使用的劣质 Stock 照片的,ChatGPT 的到来也是同样如此也,唯一的区别是它更难被注意到。

与生成的图像不同,生成的文本很难被检测到。倘若对互联网上的信息进行采样,我猜测 ChatGPT 创建的内容增长速度会非常快,毕竟现在人们正在大范围地使用它:广告、信件、编辑助手、翻译、总结、电子邮件编辑等。微软甚至做了 Office Co-Pilot 的演示,展示了一位母亲使用 Office CoPilot 给女儿写信,所以可以想象在不久的将来,互联网将被 LLM 输出或至少被 LLM 大量启发或编辑的内容所淹没。

acc04a25c7ddbc08de2a84bcf3441a5d.png

语言和思想是紧密相连的,

思维过程交给 AI 的结果可能是发展停滞

ChatGPT 是一种商业产品,OpenAI 完全有权随心所欲地调整模型,他们需要确保事情不会失控,但如果它是大模型领域唯一的模型,那会有很大的问题出现

在人类的发展中,语言不是简单的交流方式,主要用于传播我们大脑中建立的思想。语言实际上是思维过程的一部分,语言和思想并不完全相同,但它们紧密地交织在一起。考虑到这一点,人们将一部分思维的过程交给 AI 的长期后果是令人不安的。

进一步说,现在想象一下将这个过程委托给一个由一小群策划人推出高度一致的集中模型,后果是不是更加可怕。希望这不会发生,解决办法就是建立更多的模型,越独立的团队在各种架构、数据集和对齐规则上构建和训练模型,在保持语言和思想多样性方面做得越好。

显然,在 ChatGPT 输出上训练的开源模型无法实现这一目标。

384a0450e5a200ef8cb379857e59649e.png

更多基于开源数据集的 LLM 才是我们所需要的

构建那些真正的替代品(如 Open Assistant、StableLM 等)时间是非常紧迫的。OpenAI 模型非常受欢迎,它们输出的内容已经逐渐渗透整个互联网了。很快,像 CommonCrawl 和 Google  C4 这样的公共数据集也将包含它生成的内容,并且将越来越难以区分 LLM 生成的和真正有价值的内容。 

史蒂夫·乔布斯 (Steve Jobs) 有句名言,计算机就像大脑的自行车。如果执行得好,LLM 完全可以做相同的事情,而我们只需要确保所有自行车都没有被编程将我们所有人带到同一个地方。

在一个完美的世界中,像 OpenAI 和谷歌这样的大公司会给我们提供我们能与之对齐,但可供独立调整的模型,但目前这是难以达到的。因此,最好的选择是让开源模型在开源数据集上进行微调和对齐,可以在必要时重新训练或调整这些数据集。

原文链接:https://gist.github.com/mlaprise/bf4745655194162babfc2d158162e2e0

推荐阅读:

▶ 互联网惊现 AI 鬼城:人类不得入内;阿里云史上最大规模降价,最高降幅达 50%;可致微信闪退的二维码Bug已找到|极客头条

▶ ChatGPT重磅更新:可关闭聊天历史记录,企业订阅版即将发布!

▶蚂蚁链开源跨链技术 加速大规模创新应用“涌现”

61f8541d357c7f9739f10deaeb220d3a.jpeg

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/14022.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

ChatGPT赋能产品管理

在产品管理和开发过程中,可以利用ChatGPT辅助完成部分工作,提高工作生产力和创造力。原文: How to use ChatGPT in product management 相信你肯定听说过最近大火的ChatGPT,用自然语言跟机器人聊天是挺有趣,不过我还是希望探索一下…

母亲节快乐- AI绘图节日图片走一波

祝愿天下母亲节日快乐,平安喜乐。

巴比特 | 元宇宙每日必读:训练AI模型也得付钱?版权商们正审查自己“被用于训练ChatGPT”的内容,希望获得应有的补偿...

摘要:据华尔街见闻报道,AI聊天机器人凭借其出色的能力,成为环球市场的焦点,让互联网公司之间掀起了新一轮“军备竞赛”。但是,用于训练人工智能的数据,如新闻、书籍等,许多都是有版权归属的&…

ChatGPT来临,架构师何去何从?

你好,我是李运华。 最近科技圈大火的事件就是ChatGPT的全球火热流行。这款由OpenAI公司在2022年11月底推出的聊天机器人,创造了史上消费应用最快达成1亿用户的历史,在推出仅仅两个月后,月活跃用户估计已达1亿,成为历史…

再度摊上官司了?侵权之争揭秘:ChatGPT对低代码开发平台的冲击

前言 人工智能(AI)技术的迅猛发展带来了前所未有的机遇与挑战。ChatGPT作为AI技术的代表,因其出色的对话模拟功能而一度爆红。但其背后屡禁不止的侵权行为也引发了人们对AI侵权现象的广泛关注。 近年来,人工智能(Artif…

米哈游投资造火箭/ 马斯克裁员高招曝光/ 三星拍月亮是照骗…今日更多新鲜事在此...

日报君 发自 凹非寺量子位 | 公众号 QbitAI 大家好,今天是3月13日星期一,新的一周开始了。 先来和日报君一起看看最近科技圈都发生了哪些大事吧~ 马斯克辞退高薪员工伎俩曝光 为了省钱,马斯克可是使尽了各种手段。 最近&#xff0…

深入了解云计算:发展历程、服务与部署模型、未来趋势与挑战

开篇博主 bluetata 的观点:PaaS 服务必将是未来10年云计算权重最高的趋势(05/02/2023 15:32) 文章目录 一、前言二、认识了解云计算2.1 什么是云计算2.1.1 维基百科上的云计算定义2.1.2 NIST 标准云计算定义2.1.3 如果被面试如何解释云计算 2…

ChatGPT被起诉索赔30亿!OpenAI接连“吃官司”

随着ChatGPT风靡全球,其开发商OpenAI就接连不断地面临着越来越多的质疑与批评。近日,OpenAI就陷入了接连“吃官司”的状态之中。 6月29日,有16 名匿名人士向美国加利福尼亚州旧金山联邦法院提起诉讼,称 ChatGPT 在没有充分通知用…

GPT-4 考 90 分全假!30 年资深律师用 ChatGPT 打官司,6 个虚假案例成笑柄

这是「进击的Coder」的第 835 篇技术分享 编辑:桃子 拉燕 来源:新智元报道 “ 阅读本文大概需要 5 分钟。 ” 【新智元导读】ChatGPT 又有什么错呢?美国律师向法院提交的文件中,竟引用了 6 个根本不存在的案例,反倒惹…

尝试Google Bard并对比OpenAI ChatGPT,一个擅长创造性,一个擅长事实查询?

文章目录 尝试Google Bard并对比OpenAI ChatGPT,一个擅长创造性,一个擅长事实查询?Google Bard 的自我介绍Google Bard 暂时不支持中文Google Bard除了支持英语外,还支持日语Google Bard和OpenAI ChatGPT的对比Google Bard的回答O…

chatgpt赋能python:Python控制循环次数详解:多种方法实现

Python控制循环次数详解:多种方法实现 在Python编程中,循环是非常常见的操作。有时候,我们需要控制循环次数来确保程序正常运行并避免无限循环。本文将介绍Python中多种控制循环次数的方法。 1. for循环控制循环次数 for循环是最常见的循环…

奇舞周刊478期:算法工程师深度解构 ChatGPT 技术

记得点击文章末尾的“ 阅读原文 ”查看哟~ 下面先一起看下本期周刊 摘要 吧~ 奇舞推荐 ■ ■ ■ 算法工程师深度解构 ChatGPT 技术 本文用专业视野带你由浅入深了解 ChatGPT 技术全貌。它经历了什么训练过程?成功关键技术是什么?将如何带动行业的变革&am…

联网之后的ChatGPT,已经远不止“iPhone时刻”那么简单

文| Juny 编辑| VickyXiao 从默默无闻到颠覆整个互联网需要多久?OpenAI告诉你,四个月。 自从去年11月ChatGPT正式发布以来,OpenAI团队更新AI产品和技术的速度快到已经突破了人们的想象。就在上周刚刚宣布推出能力更强大的GPT-4之后&#xf…

python版电报API接入从零到一(有彩蛋)

文章链接 编号分类文章及链接介绍作者来源分类撰写日期收录日期F1框架python版telegram接入开源botpython-telegram-botGithub2023-04-24 申明:本文仅作试验研究用,不对参考本文操作产生的各种结果承担任何责任。 Q&A 使用Telegram的API需要交费吗…

chatgpt赋能python:使用Python来进行抢购,如何轻松秒杀商品

使用Python来进行抢购,如何轻松秒杀商品 在现代社会,大量的人们使用电商平台来完成他们的购物需求。然而,在疯狂的购物节日时,例如"双11",商品往往会被抢购一空。为此,许多人希望能够使用自动化…

谷歌借力AlphaGo造大模型,称其秒杀ChatGPT!

整理 | 朱珂欣 出品 | CSDN(ID:CSDNnews) 在 GPT 战场上,谷歌的口令向来是:「咱不能输」。 虽然 Bard 曾在首秀时闹出大乌龙,但谷歌如今还手握 DeepMind 这张牌。 听闻这一次,带着杀手锏出击…

chatgpt赋能python:Python如何访问网页

Python如何访问网页 Python是一种被广泛用于web开发、数据科学和人工智能的编程语言。但是,你知道Python还可以用于访问网页吗?在本文中,我们将介绍Python如何访问网页,帮助您了解Python的这一方面,并掌握它的实际应用…

ChatGPT访问量再创新高:百度的60%,谷歌的2%

点击上方“视学算法”,选择加"星标"或“置顶” 重磅干货,第一时间送达 梦晨 发自 凹非寺量子位 | 公众号 QbitAI ChatGPT上月全球访问量 17.6 亿次,已达到谷歌的2%! 根据SimilarWeb统计,已超越必应、鸭鸭走D…

chatgpt赋能python:Python如何访问文件

Python如何访问文件 Python是一种优秀的编程语言,被广泛应用于各种领域,包括文件处理。在Python中,我们可以使用内置的文件处理功能访问文件。 什么是文件? 文件是计算机系统中的一种数据存储形式。它们可以包含任何类型的信息…

李彦宏:文心大模型 3.5 版本推理速度提升 17 倍;ChatGPT 访问量增速大降;Linux 6.4 发布|极客头条

「极客头条」—— 技术人员的新闻圈! CSDN 的读者朋友们早上好哇,「极客头条」来啦,快来看今天都有哪些值得我们技术人关注的重要新闻吧。 整理 | 梦依丹 出品 | CSDN(ID:CSDNnews) 一分钟速览新闻点&…