OpenAI 最新“神”操作:让 GPT-4 去解释 GPT-2 的行为!

52c9e55714facbc09e9a70105d935ee4.gif

整理 | 郑丽媛

出品 | CSDN(ID:CSDNnews)

由 ChatGPT 掀起的这场 AI 革命,令人们感慨神奇的同时,也不禁发出疑问:AI 究竟是怎么做到这一切的?

此前,即便是专业的数据科学家,都难以解释大模型(LLM)运作的背后。而最近,OpenAI 似乎做到了——本周二,OpenAI 发布了其最新研究:让 GPT-4 去试着解释 GPT-2 的行为。

即:让一个 AI “黑盒”去解释另一个 AI “黑盒”。

67450fc89141e5cc917ee58ed0e9e2e1.png

c012a274a457ce84097c4e1ed0dea348.png

工作量太大,决定让 GPT-4 去解释 GPT-2

OpenAI 之所以做这项研究的原因,在于近来人们对 AI 伦理与治理的担忧:“语言模型的能力越来越强,部署也越来越广泛,但我们对其内部工作方式的理解仍然非常有限。”

由于 AI 的“黑盒”性质,人们很难分辨大模型的输出结果是否采用了带有偏见性质的方法,也难以区分其正确性,因而“可解释性”是亟待重要的一个问题。

AI 的发展很大程度上是在模仿人类,因而大模型和人脑一样,也由神经元组成,它会观察文本规律进而影响到输出结果。所以想要研究 AI 的“可解释性”,理论上要先了解大模型的各个神经元在做什么。

按理来说,这本应由人类手动检查,来弄清神经元所代表的数据特征——参数量少还算可行,可对于如今动辄百亿、千亿级参数的神经网络,这个工作量显然过于“离谱”了。

于是,OpenAI 灵机一动:或许,可以用“魔法”打败“魔法”?

“我们用 GPT-4 为大型语言模型中的神经元行为自动编写解释,并为这些解释打分。”而 GPT-4 首次解释的对象是 GPT-2,一个 OpenAI 发布于 4 年前、神经元数量超过 30 万个的开源大模型。

d3eabef12ff0f8dbd5e38e8d0cb6951b.png

让 GPT-4 “解释” GPT-2 的原理

具体来说,让 GPT-4 “解释” GPT-2 的过程,整体分为三个步骤。

(1)首先,让 GPT-4 生成解释,即给出一个 GPT-2 神经元,向 GPT-4 展示相关的文本序列和激活情况,产生一个对其行为的解释。

9e4880c3a19b1a2f77fc239c62842f54.png

如上图所示,GPT-4 对 GPT-2 该神经元生成的解释为:与电影、人物和娱乐有关。

(2)其次,再次使用 GPT-4,模拟被解释的神经元会做什么。下图即 GPT-4 生成的模拟内容。

0cc481febe30e710e210172386ae0adb.png

(3)最后,比较 GPT-4 模拟神经元的结果与 GPT-2 真实神经元的结果,根据匹配程度对 GPT-4 的解释进行评分。在下图展示的示例中,GPT-4 得分为 0.34。

8433a3154912631b66764d3b26809c07.png

通过这样的方法,OpenAI 共让 GPT-4 解释了 GPT-2 中的 307200 个神经元,其中大多数解释的得分很低,只有超过 1000 个神经元的解释得分高于 0.8。

在官博中,OpenAI 承认目前 GPT-4 生成的解释并不完美,尤其在解释比 GPT-2 规模更大的模型时,效果更是不佳:“可能是因为后面的 layer 更难解释。”

尽管绝大多数解释的得分不高,但 OpenAI 认为,“即使 GPT-4 给出的解释比人类差,但也还有改进的余地”,未来通过 ML 技术可提高 GPT-4 的解释能力,并提出了三种提高解释得分的方法:

  • 对解释进行迭代,通过让 GPT-4 想出可能的反例,根据其激活情况修改解释来提高分数。

  • 使用更大的模型来进行解释,平均得分也会上升。

  • 调整被解释模型的结构,用不同的激活函数训练模型。

值得一提的是,以上这些解释数据集、可视化工具以及代码,OpenAI 都已在 GitHub 上开源发布:“我们希望研究界能开发出新技术以生成更高分的解释,以及更好的工具来使用解释探索 GPT-2。”

(GitHub 地址:https://github.com/openai/automated-interpretability)

952e491b80f66a508e131f56f40b0973.png

“再搞下去,AI 真的要觉醒了”

除此之外,OpenAI 还提到了目前他们采取的方法有很多局限性,未来需要一一攻克:

  • GPT-4 给出的解释总是很简短,但神经元可能有着非常复杂的行为,不能简洁描述。

  • 当前的方法只解释了神经元的行为,并没有涉及下游影响,希望最终能自动化找到并解释能实现复杂行为的整个神经回路。

  • 只解释了神经元的行为,并没有解释产生这种行为的背后机制。

  • 整个过程都是相当密集的计算,算力消耗很大。

在博文的最后,OpenAI 展望道:“我们希望将我们最大的模型解释为一种在部署前后检测对齐和安全问题的方式。然而,在这些技术能够揭露不诚实等行为之前,我们还有很长的路要走。”

对于 OpenAI 的这个研究成果,今日在国内外各大技术平台也引起了广泛关注。

有人在意其得分不佳:“对 GPT-2 的解释都不行,就更不知道 GPT-3 和 GPT-4 内部发生了什么,但这才是许多人更关注的答案。”有人感慨 AI 进化的方式愈发先进:“未来就是用 AI 完善 AI 模型,会加速进化。”也有人担心 AI 进化的未来:“再搞下去,AI 真的要觉醒了。”

那么对此,你又有什么看法呢?

参考链接:

https://openai.com/research/language-models-can-explain-neurons-in-language-models

https://news.ycombinator.com/item?id=35877402

推荐阅读:

▶ChatGPT 之父推出加密货币钱包;Intel 被曝预算砍掉 10%、裁员 20%;Firefox 113 发布|极客头条

▶“请不要在 GitHub 上传我的代码!”

▶在 GitHub 上“搞事”,Meta 开源 ImageBind 新模型,超越 GPT-4,对齐文本、音频等 6 种模态!

8ac0f99c4d5b0882467b00d7bc3615a2.jpeg

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/30743.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

让ChatGPT猜你喜欢——ChatGPT后面的推荐系统

Chat GPT的大热,让人们的视线又一次聚焦于“人工智能”领域。通过与用户持续对话的形式,更加丰富的数据会不断滚动“雪球”,让Chat GPT的回答变得越来越智能,越来越接近用户最想要的答案。ChatGPT能否颠覆当下的推荐系统范式&…

开发者实战 | AI分割一切——用OpenVINO™加速Meta SAM大模型

点击蓝字 关注我们,让开发变得更有趣 以下文章来源于英特尔物联网,作者武卓 ChatGPT的火爆让大家看到了通用AI大模型的威力,也带动了近期一批自然语言处理(NLP)领域大模型的不断被推出。你方唱罢我登场,最近&#xff0…

万物皆可分割——用OpenVINO加速Segment Anything

作者:武卓博士 ChatGPT的火爆让大家看到了通用AI大模型的威力,也带动了近期一批自然语言处理(NLP)领域大模型的不断被推出。你方唱罢我登场,最近,计算机视觉领域也迎来了自己的物体分割大模型,…

实在智能再亮相港科大,“百万奖金创业大赛十强”、“AI数字员工”闪耀大湾区

2023年6月16日,香港科技大学(广州)INNOTECH创科嘉华暨周年庆典在广州南沙火热开展,迎来正式设立以来一周年纪念。活动邀请粤港两地政府领导、多家知名投资机构、各行业头部企业及企业家、杰出校友等共襄盛会,推进产学研…

从NVIDIA GTC大会,看AI算力行业信号

从NVIDIA GTC 2023这场全球行业盛宴,我们可以解读出AI算力行业的哪些重要信号? 一年一度的NVIDIA GTC如期而至 汇聚了全球AI与元宇宙开发者的目光焦点,NVIDIA GTC 2023于美国当地时间3月20日如期而至。 众所周知,作为全球一年一度…

一雪被 AlphaGo 狠虐的“前耻”!14:1,这次人类终于赢了围棋 AI

整理 | 郑丽媛 出品 | CSDN(ID:CSDNnews) 伴随着近期 ChatGPT 的火爆出圈,AI 再次成为了科技圈中的爆款话题。回想上次 AI 引来如此广泛关注,似乎还是 2016 年 AlphaGo 击败世界顶级棋手李世石的时候。 AlphaGo 有多强…

万物皆可分割——用OpenVINO™加速SAM (Segment Anything Model)

ChatGPT的火爆让大家看到了通用AI大模型的威力,也带动了近期一批自然语言处理(NLP)领域大模型的不断被推出。你方唱罢我登场,最近,计算机视觉领域也迎来了自己的物体分割大模型,由Meta开源的 “万物可分割 …

张亚勤对话朱民:颠覆认知的AI时代及产业机遇

来源:财经ThinkTank 4月28日,清华大学智能产业研究院院长、中国工程院外籍院士张亚勤与清华大学国家金融研究院院长、著名经济学家朱民进行对话。 张亚勤表示,对于ChatGPT横空出世,自己有三个感悟,一是人类历史上第一次…

清华大学张亚勤对话朱民:颠覆认知的AI时代及产业机遇

来源:财经ThinkTank 4月28日,清华大学智能产业研究院院长、中国工程院外籍院士张亚勤与清华大学国家金融研究院院长、著名经济学家朱民进行对话。 张亚勤表示,对于ChatGPT横空出世,自己有三个感悟,一是人类历史上第一次…

摘掉 Chat 标签,GPT-4 将释放更大生产力

相比 ChatGPT 能力有大进化,多模态上有突破但不多。 作者丨李梅 黄楠 编辑丨岑峰 今日,多模态大模型 GPT-4 震撼登场! GPT-4 能够接受图像和文本输入,输出文本,在各项测试和基准上的表现已经与人类水平相当。 OpenAI 一…

AI 图像生成工具可以取代摄影师吗?让我们从原理开始聊聊

AI 的风已经吹向了每一个人,在这篇文章中我们一起来聊一聊 AI 图像生成的原理以及未来。 作为一个非职业的摄影爱好者,我通常会在 Instagram 上面搜罗各种各样的优质图片并将其放进我的收藏夹。其中,有一位我关注了很久的德国摄影师&#xff…

只限今日免费,Midjourney 5.1震撼更新!逼真到给跪,中国情侣细节惊艳,3D视频大片马上来...

点击上方“AI遇见机器学习”,选择“星标”公众号 第一时间获取价值内容 编辑:桃子 拉燕 【导读】全新升级的Midjourney让全网又疯狂了,创造力解禁,出图更逼真。重要的是,限时免费到今天,要玩的抓紧了。 一个…

GPT4震撼发布,哈佛教授:程序员职业3年内将被终结

全球科技界又有重磅消息!GPT-4,横空出世了! 此前,火遍全球的CHATGPT是在GPT-3.5基础上的产品,而GPT-4就是在GPT-3.5等老一代AI上迭代出来的。 OpenAI老板也抑制不住激动的宣布:“这是我们迄今为止功能最强…

量化学习——跟随龙虎榜交易

import pandas as pd import numpy as np #efinance是金融数据包,可免费爬取东方财富交易数据 #直接使用pip install efinance安装 import efinance as ef import matplotlib.pyplot as plt #seaborn、plotly可视化包 import seaborn as sns import plotly_express …

公司拿到了量化交易模型, 交易员和策略师就可滚蛋了?

作者:天启大烁哥 源自:天启量投(ID:QDLG001) 在知乎上看到了一个很有趣的问题。 在这个问题下面,提问者留了一些自己的看法: 有种感觉,资本一直试图用电脑代替人,把人的…

国内量化平台不完全汇总

开始量化交易的第一步就是对比、选择各家量化平台了,这里列出一些面向个人的平台,仅供大家参考: 1、Ptrade 恒生出品,国内最主流的量化平台之一,合作券商多,5w甚至更低即可开权限。支持python&#xff0c…

七天学会python量化交易(一)

七天学会python量化交易 1、程序下载安装后,先补充一下历史数据 2、核心代码部分:(核心代码注意的一个事项,用价格与MA对比的时候,记住一个是close[-1]一个是close[-2] #-------------------------------------------…

运用Python开通量化交易实盘介绍

目前可以接通实盘的量化平台来说,聚宽、果仁、讯投qmt等都是用户量比较多的平台,带有模拟盘功能,可以开通试用账户,但具体如何选择需要根据自身的编程基础情况和资金情况来定。 如果是有一定的计算机语言基础,有编程基…

经典的量化交易算法

作者:徐Jebs 来源:知乎 加权平均价格算法(VMAP):以每一次交易的成交量为权重,一段时间内成交价格的加权平均值。该策略即利用历史成交量数据,将大段时间内的订单分割,成…

十次 CV 论文会议投稿的经验总结

文章目录 导语论文生产发表流程写好论文的意义创新点和论文核心论文的写作要点笔者的论文投稿常见的负面审稿意见总结 导语 2021年来,笔者在多次论文被拒稿期间,开始研究和反思顶会论文生产到投稿的全流程,并全程参与了十几篇论文的审稿。近…