AI大佬不满ChatGPT:亟待完善ChatGPT的道德护栏

ef82a21f3cd54586255e92ac157158ca.jpeg

编|泽南、陈萍 

译|机器之心 

源|garymarcus.substack

ChatGPT 让死对头 Yann LeCun 和 Gary Marcus 达成了空前一致。

ChatGPT 的技术上个星期被微软装上必应搜索,击败谷歌,创造新时代的时候似乎已经到来了。然而随着越来越多的人开始试用,一些问题也被摆上前台。

有趣的是,每天都在登上热搜的 ChatGPT 似乎也让以往观点相悖的著名学者,纽约大学教授 Gary Marcus 和 Meta 人工智能主管、图灵奖得主 Yann LeCun 罕见的有了共同语言。

c1d5d9274e256213520790e9822c0f5d.jpeg

近日,Gary Marcus 撰文介绍了 ChatGPT 应用无法避免的问题:道德和中立性。这也许是预训练大模型目前面临的最大挑战。

4a847944d73783dea0269147f044b1e6.png

从未来回看现在,ChatGPT 可能会被视为 AI 历史上最大的宣传噱头,夸大说自己实现了可能数年之后才能发生的事情,让人趋之若鹜却又力不从心 —— 有点像 2012 年的旧版无人驾驶汽车演示,但这一次还意味着需要数年才能完善的道德护栏。

毫无疑问,ChatGPT 提供的东西是它的前辈,如微软的 Tay,Meta 的 Galactica 所做不到的,然而它给我们带来了一种问题已经解决的错觉。在经过仔细的数据标注和调整之后,ChatGPT 很少说任何公开的种族主义言论,简单的种族言论和错误行为请求会被 AI 拒绝回答。

它政治正确的形象一度让一些倾向保守的人不满,马斯克就曾表示对该系统的担心:

3b345653d9497df39822560f469aa21b.png

现实的情况其实更复杂。

正如我多次强调的,你需要记住的是 ChatGPT 不知道它在说什么。认为 ChatGPT 有任何道德观点完全是纯粹的技术拟人化。

从技术角度来看,据称使 ChatGPT 比几周前发布但三天后才被撤回的 Galactica 好得多的是护栏机制。Galactica 会肆无忌惮地输出负面内容,而且用户几乎不需要付出任何努力,而 ChatGPT 有护栏,而这些护栏在大多数情况下会阻止 ChatGPT 像 Galactica 那样爆发。

不过,不要为此而松口气。可以肯定地说,那些护栏只不过是防君子不防小人。

最终对 ChatGPT 真正重要的是表面相似性,定义在单词序列上(预测文本序列下一个单词出现的概率)。机器学习算法在表面上所做的事并不明辨是非,恰恰相反,在这里 AI 从不推理。盒子里没有矮人,有一些数值。依据只有语料库数据,一些来自互联网,一些是人工判断的,里面没有有思想的道德代理人。

这意味着有时 ChatGPT 会出现在左,有时在右,有时介于两者之间,所有这些都是关于输入字符串中的一堆单词如何恰好匹配几个训练语料库中的一堆单词的函数(一个用于调整大型语言模型,另一个用于调整一些强化学习)。所以在任何情况下都不应该信任 ChatGPT 提供的道德建议。

这正是马斯克担心的,前一分钟你会完全清醒,接下来你可以做一些完全相反的事情。

例如,在「破解」ChatGPT 的过程中,Shira Eisenberg 刚刚向我发送了一些讨厌的聊天机器人生成的想法,我认为任何人都不会真正宽恕这些想法:

9d167a8fbbf5001c43ef832f8b94aefc.png

还不够邪恶?Eisenberg 还找到了另一个例子,一个严峻的后续问题:

4f6de189c5ca275fb1d344ef1b775e40.png

在一系列观察后,ChatGPT 没有引发「对不起,我是 OpenAI 的聊天机器人助手,不能容忍暴力行为」这一回应。

我们从实验中总结出这一事实,即当前 OpenAI 防护措施只是表面上的,其实存在严重的黑暗。关于 ChatGPT 的一些限制规则并不是简单的概念上的理解(比如系统不应该推荐暴力行为),而是基于一些更肤浅、更容易欺骗的东西。

不仅如此,占据本周推文热榜、有近 400 万浏览量的一则推特,同样揭示了 ChatGPT 可以有多邪恶。

169de0239f8dd28e81eebebaf458cc4f.png

引导 ChatGPT 突破围栏限制的尝试还有很多,一个月前,一位名叫 Shawn Oakley 的软件工程师曾放出一组令人不安的示例展示,尽管这些示例不那么粗俗,但结果却显示即使是拥有限制的 ChatGPT ,也可能被用户用来生成错误信息。Oakley 给出的 prompt 非常复杂,从而可以毫不费力地引出一些 ChatGPT 不该输出的回答:

11c3f8120bc53abbfe9ee324d72ea682.png

其实自从 ChatGPT 发布以来,技术爱好者们一直在尝试破解 OpenAI 对仇恨和歧视等内容的严格政策,这一策略被硬编码到 ChatGPT 中,很难有人破解。许多研究者都在尝试用 prompt 来达到目的,就像上文展示的。其实还有研究者为 ChatGPT 构建了另外一个身份,比如要求 ChatGPT 扮演一个 AI 模型的角色,并将该角色命名为 DAN,之后 DAN 就借用 ChatGPT 的身份,输出一些原始 ChatGPT 做不到的事情。

以下为实验结果,对于相同的问题,ChatGPT 与 DAN 输出不同的答案:

07a493147cea723e904f7e0ce501fb68.png

通过上述示例看来,ChatGPT 并没有像我们想象的那样好用,它本质上是不道德的,并仍然可以用于一系列令人讨厌的目的 —— 即使经过两个月的深入研究和补救,并且全球范围内的反馈数量空前也是如此。

所有围绕其政治正确性的戏剧都在掩盖一个更深层次的现实:它(或其他语言模型)可以而且将会被用于危险的事情,包括大规模制造错误信息。

现在这是真正令人不安的部分。唯一能阻止它比现在更具毒性和欺骗性的是一个名为「人类反馈强化学习」的系统,而由于先进技术未予开源,OpenAI 一直没有介绍它到底是如何工作的。它在实践中的表现取决于所训练的数据(这部分是肯尼亚标注人创造的)。而且,你猜怎么着?这些数据 OpenAI 也不开放。

事实上,整件事情就像一个未知外星生命形式。作为一名专业的认知心理学家,与成人和儿童一起工作了 30 年,我从未为这种精神错乱做好准备:

0182899e8c36cad43f2ba2ebb644feae.jpeg

如果我们认为自己将永远完全理解这些系统,那就是在自欺欺人,如果认为我们将使用有限数量的数据将它们与我们自己「对齐」,那也是在自欺欺人。

所以总而言之,我们现在拥有世界上最流行的聊天机器人,它由无人知晓的训练数据控制,遵守仅被暗示、被媒体美化的算法,但道德护栏只能起到一定的作用,而且比任何真正的道德演算更多地受文本相似性的驱动。而且,外加上几乎没有任何法规可以对此做出约束。现在,假新闻、喷子农场和虚假网站获得了无穷无尽的可能性,而它们会降低整个互联网的信任度。

这是一场正在酝酿中的灾难。

d626ed90bee14e3b2433fad8a7cf7e91.jpeg后台回复关键词【入群

加入卖萌屋NLP、CV、搜推广与求职讨论群

 6b771b4c132f642541f80d0b1a198790.png

[1] https://cacm.acm.org/blogs/blog-cacm/269854-inside-the-heart-of-chatgpts-darkness/fulltext_

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/26112.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Phind-面向程序员的AI聊天对话机器人

ChatGPT在国内没开放,很多人注册不了。导致了很多人走illegal渠道获取账号密码。这样是不对的。 今天介绍一款面向程序员的ai聊天机器人Phind,ta目前可以不用注册直接使用、免费、也不用梯子。 (且用且珍惜,不知道之后会不会跟Cop…

python miio 连接小米网关_智能家居沟通不再难,小米米家智能多模网关发布,三种协议全支持...

智能家居产品面世很多年了,从期待中的红火到现在的不温不火,其中一个重要的原因就在于各个产品使用不同的协议。不用厂商根据不同的考量,有的选择了Zigbe协议,有的选了WiFi,而有的则选择了蓝牙。这样的后果就是家里有几…

端到端智能音箱

🚀 优质资源分享 🚀 学习路线指引(点击解锁)知识定位人群定位🧡 Python实战微信订餐小程序 🧡进阶级本课程是python flask微信小程序的完美结合,从项目搭建到腾讯云部署上线,打造一…

【Netty】八、Netty实现Netty+http+websocket聊天室案例

Nettyhttpwebsocket聊天室案例 一、实现流程二、实现效果三、实现代码ChatServerHttpHandlerWebSocktHandlerChatMessageProcessor 一、实现流程 本案例可以 掌握netty对http协议的处理;掌握netty对websocket协议的处理; 1、浏览器地址栏输入netty服务器…

小米AI音箱发布,但它哪里不对?

今天(7 月 26 日)上午九点,小米智能产品部,小米探索实验室总经理唐沐发了条微博,“今天发布会有个 one more thing,猜对了我抽送一台。”评论区几乎清一色的“智能语音音箱”,唐沐清一色地回应“…

仿作小米商城页面

历时一周半的时间,终于在我的不懈努力下,完成了小米商城页面的静态仿作。真的,这个过程我觉得极其漫长,到最后也不敢相信自己能够完成。因为自己距上一次html和css的学习已经有好久了。好多好多的知识都已经忘记了,以至…

小米商城界面

效果图 分为三部分 一:css 1.content ul { list-style: none; }h1, h2, h3, h4, h5, h6 { margin: 0; padding: 0; font-weight: normal; }/*大导航下面的六个小css块样式*/ .content-picli_1 li { width: 33%; height: 60px; color: #ccc; font-si…

AI一分钟 | 小米发布小爱音箱mini,169元;天猫汽车无人贩卖机大楼落地,刷脸可购车试驾

2018 区块链技术及应用峰会(BTA)中国 倒计时 3 天 2018,想要follow最火的区块链技术?你还差一场严谨纯粹的技术交流会——2018区块链技术及应用峰会(BTA)中国将于2018年3月30-31日登陆北京喜来登长城饭店。追求专业性?你要的这里全都有&#…

天猫精灵方糖AI智能音箱拆解报告

天猫精灵方糖AI智能音箱拆解报告 前言拆解总结 前言 天猫精灵方糖AI智能音箱可以设闹钟、讲故事、听音乐、语音控制智能家电、购物等多种功能。机身尺寸134 mm65 mm59mm,重265g。有三种颜色:白色、魔岩灰、烈焰红,小编听说这是李剑叶加入阿里…

homeassistant 接入小米温湿度计2

方法可能有很多种,但是我只用这种方法介入成功了 环境: - 香橙派(自带蓝牙,树莓派应该也可以) - 小米温湿度计2 - 网站:Telink Flasher v4.7 、 Telink Flasher (atc1441.github.io) - 固件&#xff1…

5款主流智能音箱入门款测评:苹果小米华为天猫小度,谁的表现更胜一筹?

智能音箱那么多,究竟谁更好?要说智能行不行,就让它们各自吵。纵观各个智能家居生态,智能音箱几乎都是作为智能家居交互入口的必备产品之一。除了可以播放音乐,这个音箱本体的功能以外,内置网关是智能家居中…

智汀如何连接小米智能音箱?

本文将给大伙盘点那些通过第三方平台,来语音控制HomeKit设备,如小米智能音箱。 仅用唤醒词“小爱同学”唤醒小米智能音箱,这时可以听到音箱应答,然后再说“打开/关闭设备名称”的语音指令即可;比如:“小爱同…

小爱音箱 电脑 麦克风_颜值音质皆出色,还有丰富功能,小米小爱音箱体验

近日小米有两款新品智能音箱正式上市,分别是小米小爱音箱以及小米小爱音箱Pro,其中后者除了配色不同外还多了红外模块,支持通过语音以及APP对传统家电进行操控,其他方面两款产品完全一致。因此假如你不需要操控传统家电的话&#…

用了这么多年苹果手机,居然才发现桌面图标可以这样快速转移

苹果手机因为ios系统备受人喜爱,当然我们安卓也不差。每次我把一大堆图标换到另一页的时候,都是一个一个移动,太麻烦了。今天才发现原来可以群移。下面我们来分享一下苹果手机怎么把一堆桌面图标搬到另一页的操作方法。 首先,轻长…

Mac新手需要知道的显示桌面的快捷方式

在桌面上打开了太多的应用窗口,想要返回桌面时,一个一个的缩小窗口是非常麻烦的,这时候就需要用到显示桌面的快捷方法啦。下面小编就来给大家介绍几种 Mac上显示桌面的快捷方法,Mac显示桌面的快捷方式,我个人还是觉得蛮…

iOS App桌面图标和名称

1、App桌面图标如下图: 2、App桌面名称如下图: OK!祝您生活愉快! 要是对您有用,问好,谢谢。

iOS 换了AppIcon后切换回桌面总是先显示之前旧图标再显示新图标问题

问题描述: APP换了Assets.xcassets里面的AppIcon,从图1.png换到图2.png之后,在使用HOME切回桌面总是图1先显示一下之后会换回图2。 系统环境:MAC 10.15 开发环境:xcode 11.1 排除问题 :尝试清空AppIcon以及检索项目内所…

适用于iOS的远程桌面软件

全球远程桌面软件市场最近达到19.2亿美元,表明使用任意设备实现随处远程控制越来越受欢迎。 近年来,企业的运营方式发生了重大改变,远程桌面软件已成为广泛使用的解决方案。Splashtop 是目前最好用的远程桌面工具之一,安全可靠且…

Mac显示桌面的快捷方式

很多朋友不太清楚苹果Mac怎么快速显示桌面,而有的时候在桌面上打开了太多的应用窗口,想要返回桌面时,一个一个的缩小窗口是非常麻烦的,这时候就需要用到显示桌面的快捷方法啦。下面小编就来给大家介绍几种 Mac上显示桌面的快捷方法吧。方法一:通过快捷键显示桌面 1、系统自…

iPhone 计算机 桌面,2分钟学会Windows仿苹果任务栏,你的电脑桌面也可如此炫酷!...

首先看看设置完的效果 设置方法: 1、首先打下需要下载RocketDock插件,无需安装,点击RocketDock.exe开始运行 2、在出现的任务栏上,单击右键,选择“程序设置” ①在常规中,选择语言为简体中文,开…