GPT-4的黑箱运作方式引科学家不满

a38090bd74d032f8e82a309aa13cb791.jpeg

原文作者:Katharine Sanderson

科研人员对这项AI技术充满期待,但对其底层技术的秘而不宣感到不满。

上周,人工智能公司OpenAI推出了GPT-4——驱动其热门对话机器人ChatGPT的大型语言模型的最新版本。这个语言模型能根据几乎任何提示创作有人类文笔的文本并生成图像和程序代码,而且表现十分惊艳。该公司表示,GPT-4在此基础上又有了很大的提升。研究人员认为这些能力有望推动科研变革,但也有人感到不满,因为他们还没有使用权限,也不了解它的底层代码或是训练方式。科学家认为,这种情况下,人们对该技术的安全性会有顾虑,其对科研的帮助也不如预想的这么大。

837ab9004fab323f2f2acd22e225dda5.jpeg

人工智能模型GPT-4尚未向所有用户开放。来源:Jaap Arriens / NurPhoto via Getty Images

3月14日公布的GPT-4有一个全新升级:它现在不仅可以处理文本,还可以处理图像。作为对其语言能力的演示,位于加州旧金山的OpenAI表示,GPT-4已经能通过美国律师资格考试,成绩位于第90百分位,而之前的ChatGPT版本只能进入第10百分位。不过,这项技术尚未向所有人开放,目前只有ChatGPT的付费用户可以使用。

“现在需要在等位名单上排队,还不能立刻就用上。”阿姆斯特丹大学心理学家Evi-Anne van Dis说。不过,她已经见过GPT-4的demo。她说:“我们在视频里看过他们演示GPT-4的一些能力,简直超乎想象。”她记得,有一次演示用了一个网站的手绘插画,GPT-4能根据这些插画生成构建该网站的代码,证明它能将图像转化为输入信息的能力。

不过,OpenAI对它的模型使用哪些数据训练、如何训练,以及它的运作方式讳莫如深,这令科研人员感到不满。“所有这些闭源模型可以说是科学界的死胡同,”开源AI社区HuggingFace的气候科学家Sasha Luccioni说,“他们【OpenAI】可以在他们的研究基础上越攀越高,但对整个科学界来说,这就是条死路。”

“红队”测试

美国罗切斯特大学的化学工程师Andrew White以“红队队员”(red-teamer)的身份优先体验了GPT-4。OpenAI付费邀请这些红队队员测试该平台,他们会尝试让GPT-4做些不好的事情。他说,他在过去6个月都可以使用GPT-4。“与之前几代相比,一开始它好像也没什么特别之处。”

他会询问这个机器人合成某个化合物需要哪些反应步骤,让它预测反应产物并选择催化剂。“起初我没觉得它有多强大,”White说,“令人惊讶的是它看起来特别像回事,但它会在这里幻想出一个原子,在那里跳过一个步骤。”不过,就在他按照他们红队的任务给GPT-4开放科研论文的权限后,情况急剧变化。“我们发现,这类模型独立存在时可能没什么厉害之处,但当你把它和互联网和逆合成设计功能(retrosynthesis planner)等工具,或是和计算器相连,突然之间,新的能力全部出现了。”

当然,这些能力也伴随着隐忧。比如,GPT-4会允许合成危险化学品吗?利用White等人的输入信息,OpenAI的工程师再把这些信息“投喂”给他们的模型,让GPT-4避免生成危险、非法、有害的内容,White说道。

捏造事实

不实信息是另一个问题。Luccioni表示,GPT-4一类模型的功能是预测一句话的下一个词,所以无法完全摆脱胡编乱造的问题,这种现象也成为“幻觉”(hallucinating)。她说:“你不能全信这些模型,因为它的幻觉太多了。”即使是最新版本也仍有这个问题,她说,尽管OpenAI表示已经提升了GPT-4的安全性。

如果不公开训练所使用的数据,OpenAI关于安全性的担保在Luccioni看来是不够的。她说:“你不知道它用了哪些数据,你就无法优化它。我的意思是,把科研工作教给这样一个模型肯定是不现实的。”

围绕GPT-4训练方式的谜团对van Dis在阿姆斯特丹大学的同事、心理学家Claudi Bockting来说也是一个担忧。“让人类对他无法监督的东西负责是很难的,”她说,“一个担忧是它们的偏见可能远远超过人类自己的偏见。” Luccioni解释道,如果无法获得GPT-4的底层代码,你就无法判断偏见是来自哪里,自然也就没法纠正了

伦理探讨

Bockting和van Dis还担心这些AI系统今后都会被大型科技公司收入麾下。他们希望这项技术能得到科学家的严格测试和验证。她说:“这里也有机遇,因为与科技巨头的合作能加快前进速度。”

van Dis、Bockting和同事在今年更早时指出,亟需建立一套“活”指南,指导AI和GPT-4等工具的使用和开发。他们担心关于AI技术的任何法规很难跟上AI发展的步伐。Bockting和van Dis已经组织4月11日在阿姆斯特丹大学召开研讨会,探讨上述问题,与会代表来自联合国教科文组织的科学伦理委员会、经济合作与发展组织、世界经济论坛等组织。

White认为,抛开种种顾虑,GPT-4及其未来迭代势必会重塑科学。他说:“我相信这将是科研基础架构的一次重大变革,堪比当初互联网带来的巨大震动。”它不会取代科学家,他说,但能协助科学家开展某些工作。“我认为我们将慢慢意识到,我们能把论文、数据程序、我们用的图书库与计算工作,甚至是机器人实验全部互联。

原文以GPT-4 is here: what scientists think标题发表在2023年3月16日《自然》的新闻版块上

© nature

doi: 10.1038/d41586-023-00816-5

点击阅读原文查看英文原文

点击文字或图片阅读相关文章

ChatGPT颠覆传统搜索引擎,它的回答能信几分?

0f5eaac793c44208570f605c67c7df69.jpeg

ChatGPT与科研:革新与隐患共存 |《自然》长文

56d6bf3d45fbb29431c26c7e01846343.jpeg

ChatGPT威胁科研透明,《自然》等期刊提出新要求

765ed32e411ac7dab31d4c09a533a3a6.jpeg

版权声明:

本文由施普林格·自然上海办公室负责翻译。中文内容仅供参考,一切内容以英文原版为准。欢迎转发至朋友圈,如需转载,请邮件China@nature.com。未经授权的翻译是侵权行为,版权方将保留追究法律责任的权利。

© 2023 Springer Nature Limited. All Rights Reserved

星标我们🌟,记得点赞、在看+转发哦!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/13364.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

产品未出 百度朋友圈“开演”

ChatGPT这股AI龙卷风刮到国内时,人们齐刷刷望向百度,这家在国内对AI投入最高的公司最终出手了,大模型新项目文心一言(ERNIE Bot)将在3月正式亮相,对标微软投资的ChatGPT。 文心一言产品未出,百…

3·15特辑 | 少侠,可曾听说ChatGPT也有“食品安全问题”?

3月15日,有两件事情最吸引国内网民的眼球:一件是牵动所有消费者的315晚会,另一件则是ChatGPT母公司OpenAI于当日凌晨发布了再次爆火出圈的GPT-4。 据媒体报道,相比于ChatGPT之前所使用的GPT-3.5 架构,GPT-4实现了以下几…

最佳实践 | 用腾讯云智能语音打造智能对话机器人

在AI技术的推动下,智能对话机器人逐渐成为我们工作、生活中的重要效率工具,乃至是伙伴,特别是为企业带来最原始最直观的“降本增效”落地实现。 作为开发者,你是否有想过基于语音技术打造一款智能对话机器人呢? 本文将…

大语言模型(LLM)发展历程及模型相关信息汇总(2023-07-12更新)

大语言模型(large language model,LLM)发展历程及模型相关信息汇总(2023-07-12更新) LLM发展时间轴:以下用表格形式汇总了从 BERT(2018-10-11)到 Baichuan(203-06-15)共计 58种语言大…

一些常用的搜索技巧总结

最近ChatGPT的出现让全网哗然,其对自然语言和代码的处理能力,对文字的理解能力和固定模板下的创作能力都强得离谱。但比起这些,最令我惊讶的还是他及其庞大的知识库。数以千亿计的训练数据让他切实的做到了博古通今。在我看来,拥有…

chatgpt赋能Python-pycharm改名字

PyCharm更名为JetBrains PyCharm——专属Python开发者的最佳IDE JetBrains PyCharm是一款Python开发者最喜欢使用的IDE之一。然而,在2021年初,这款世界著名的Python IDE进行了一次重大更名——PyCharm更名为JetBrains PyCharm。在这篇文章中&#xff0c…

Claude 使用教程 AI助手,可平替Chatgpt,无需魔法

今天来分享下Claude AI工具2023-4月最新使用方法, Claude是Anthropic公司开发的一种基于大型语言模型的AI助手,类似于ChatGPT。 背景:Anthropic是一家由OpenAI的前联合创始人Dario Amodei和他的妹妹Daniela Amodei创立的AI研究公司 。他们的…

使用魔法改善魔法,用chatgpt生成剪贴板保存工具减轻工作量

最近开始使用chatgpt生成代码来编写小工具,大部分时候还算靠谱,就是每次从网页上粘贴内容到编辑器中比较麻烦,尤其是chatgpt洋洋洒洒,给了若干个程序代码,一个个的粘贴真是要了老命了。 试了试cursor,发现也…

Claude 免注册教程

前 OpenAI 副总裁创建的人工智能新项目 “Claude” 来了,有望与 ChatGPT 展开激烈竞争。 Claude 是什么? Claude 是由人工智能安全创业公司 Anthropic 开发的 AI 产品。Anthropic 由多位知名高校的人工智能专家联合创立,其宗旨是研究如何设计…

天津市人工智能计算中心揭牌 天下津梁融汇AI之力

“九河下稍天津卫,三道浮桥两道关”,这是天津人熟知的一句话,意思是九河下稍的尽头是天津卫,是说天津是九条河流的入海口。自明永乐二年天津设卫以来,这座城市就是江河汇聚、贯通南北的水陆码头。天津名字的由来之一&a…

昇腾AI深耕沽上:港口辐射力之后,天津再添基础创新辐射力

作者 | 曾响铃 文 | 响铃说 AI计算正在以新基建联动产业集群的方式,加速落地。 不久前,天津市人工智能计算中心正式揭牌,该中心整体规划300P算力,2022年底首批100P算力上线投入运营,并实现上线即满载。 这是昇腾AI…

AIGC:StableLM 简介

文章目录 [toc]简介应用实践小结其他 简介 众所周知,去年初创公司 Stability AI 发布的 AI 图像生成工具 Stable Diffusion,成为一种革命性的图像模型,也使 AI“文生图”实现了飞速的发展。满载着大家对其“不再局限于开发图像生成”和“开源…

Stable Diffusion公司开源大语言模型StableLM,网友:不是我想要的!

整理 | 朱珂欣 出品 | CSDN(ID:CSDNnews) 众所周知,去年初创公司 Stability AI 发布的 AI 图像生成工具 Stable Diffusion,成为一种革命性的图像模型,也使 AI“文生图”实现了飞速的发展。 满载着大家对其“…

copilot使用教程

Copilot简介 Copilot是⼀种基于⼈⼯智能的代码⾃动补全⼯具,由OpenAI和GitHub共同开发。它使⽤⼈⼯智能算 法来分析代码库,并根据上下⽂和编程语⾔的语法提⽰,⾃动⽣成⾼质量的代码。⽬前,Copilot只能 与GitHub上的代码库集成&…

zblog负载过高导致访问不流畅处理办法

当您的zblog负载过高时,可能会导致网站响应时间过长,甚至无响应。这会影响到您的访客体验,同时也会影响您的网站排名。以下是一些应对方法: 1. 增加服务器资源:如果您的服务器配置过低,可以考虑增加资源&am…

Stable Diffusion公司开源大语言模型StableLM,网友:能把人逼疯!

整理 | 朱珂欣 出品 | CSDN(ID:CSDNnews) 众所周知,去年初创公司 Stability AI 发布的 AI 图像生成工具 Stable Diffusion,成为一种革命性的图像模型,也使 AI“文生图”实现了飞速的发展。 满载着大家对其“…

GPT 学术优化 (ChatGPT Academic)搭建过程(含ChatGLM cuda INT4量化环境和newbing cookie)

文章目录 1、GPT Academic2、chatGPT3、chatGLM4、newbing 1、GPT Academic 项目地址:地址 安装部分 git clone https://github.com/binary-husky/chatgpt_academic.git cd chatgpt_academicconda create -n gptac_venv python3.11 conda activate gptac_venv pyt…

OpenAI GPT3.5/GPT3 + Flask 制作自己的交互网页教程 | 附源码 和 Github链接

1. OpenAI GPT API 1.1 GPT 3.5 API (更新) 真正的 ChatGPT API, gpt-3.5-turbo,终于来了!不同于之前的 GPT3 text-davinci-003 的 api 版本。 GPT 3.5 版本生成的回答将十分的智能。 下图是现在OpenAI提供的模型。…

ChatGLM实战 - 文本信息抽取

1. ChatGLM介绍 ChatGLM-6B 是一个开源的、支持中英双语的对话语言模型,基于 General Language Model (GLM) 架构,具有 62 亿参数。结合模型量化技术,用户可以在消费级的显卡上进行本地部署(INT4 量化级别下最低只需 6GB 显存&…

【ChatGLM】本地版ChatGPT ?6G显存即可轻松使用 !ChatGLM-6B 清华开源模型本地部署教程

目录 感谢B站秋葉aaaki大佬 前言 部署资源 部署流程 实机演示 ChatGML微调(人格炼成)(个人感觉蛮有趣的地方) 分享有趣の微调人格 实机演示(潘金莲人格) 感谢B站秋葉aaaki大佬 秋葉aaaki的个人空间…