Transformers 如何模仿大脑的某些部分

22e282cc1af152c1a3b6a2da77037879.png

来源:ScienceAI

编译:白菜叶

了解大脑如何组织和访问空间信息「我们在哪里」,「拐角处有什么」,「如何到达那里」,这仍然是一项艰巨的挑战。该过程涉及从数百亿个神经元中调用整个记忆网络和存储的空间数据,每个神经元都连接到数千个其他神经元。

神经科学家已经确定了关键元素,例如网格细胞、映射位置的神经元。但更深入将被证明是棘手的:并不是说研究人员可以移除或研究人类灰质的切片来观察基于位置的图像、声音和气味记忆是如何流动并相互连接的。

人工智能提供了另一种方式。多年来,神经科学家利用多种类型的神经网络——为大多数深度学习应用程序提供动力的引擎——来模拟大脑中神经元的放电。

在最近的工作中,研究人员表明,海马体是一种对记忆至关重要的大脑结构,基本上是一种特殊的神经网络,被称为 Transformer。他们的新模型以与大脑内部运作相似的方式跟踪空间信息。他们已经看到了非凡的成功。

「我们知道这些大脑模型相当于 Transformer,这一事实意味着我们的模型表现得更好,更容易训练。」来自斯坦福大学的认知神经科学家 James Whittington 说。

Whittington 和其他人的研究表明,Transformer 可以极大地提高神经网络模型模拟网格细胞和大脑其他部分进行的各种计算的能力。Whittington 说,这样的模型可以推动我们对人工神经网络如何工作的理解,甚至更有可能推动我们对大脑中如何进行计算的理解。

「我们并不是要重建大脑。」谷歌大脑的计算机科学家 David Ha 说,他也在研究 Transformer 模型,「但我们能否创造一种机制来完成大脑所做的事情?」

Transformers 于五年前首次出现,是人工智能处理语言的一种新方式。它们是 BERT 和 GPT-3 等引人注目的补句程序中的秘密武器,可以生成令人信服的歌词、创作莎士比亚十四行诗并模仿客户服务代表。

Transformers 使用一种称为自我注意的机制工作,其中每个输入——一个单词、一个像素、一个序列中的数字——总是连接到每个其他输入。(其他神经网络仅将输入连接到某些其他输入。)但是,虽然转换器是为语言任务而设计的,但它们后来在其他任务上表现出色,例如对图像进行分类——现在是大脑建模。

2020 年,由奥地利林茨约翰内斯·开普勒大学的计算机科学家 Sepp Hochreiter 领导的一个小组使用 Transformer 改造了一个强大的、长期存在的记忆检索模型,称为 Hopfield 网络。40 年前由普林斯顿物理学家 John Hopfield 首次提出,这些网络遵循一般规则:同时活跃的神经元彼此建立牢固的联系。

Hochreiter 和他的合作者指出,研究人员一直在寻找更好的记忆检索模型,他们看到了 Hopfield 网络如何检索记忆与转换器如何执行注意力之间的联系。他们升级了 Hopfield 网络,基本上把它变成了一个Transformer。Whittington 说,由于更有效的连接,这种变化使模型能够存储和检索更多的记忆。Hopfield 本人与 MIT-IBM Watson AI 实验室的 Dmitry Krotov 一起证明了基于Transformer的 Hopfield 网络在生物学上是合理的。

然后,今年早些时候,Whittington 和 Behrens 帮助进一步调整了 Hochreiter 的方法,修改了转换器,以便不再将记忆视为线性序列——就像句子中的一串单词——而是将它们编码为高维空间中的坐标。正如研究人员所说,这种「扭曲」进一步提高了模型在神经科学任务上的表现。他们还表明,该模型在数学上等同于神经科学家在 fMRI 扫描中看到的网格细胞放电模式模型。

伦敦大学学院的神经科学家 Caswell Barry 说:「网格细胞具有这种令人兴奋、美丽、规则的结构,并且具有不太可能随机出现的引人注目的图案。」这项新工作展示了 Transformer 如何准确复制在海马体中观察到的那些模式。「他们认识到,Transformer 可以根据以前的状态以及它的移动方式来确定它的位置,并且以一种与传统网格单元模型相结合的方式。」

最近的其他研究表明,Transformers 也可以促进我们对其他大脑功能的理解。去年,麻省理工学院的计算神经科学家 Martin Schrimpf 分析了 43 种不同的神经网络模型,看看它们对 fMRI 和皮层脑电图报告的人类神经活动测量结果的预测效果如何。他发现,Transformers 是目前领先的、最先进的神经网络,几乎可以预测成像中发现的所有变化。

Ha 和计算机科学家 Yujin Tang 最近设计了一个模型,该模型可以有意地通过 Transformer 以随机、无序的方式发送大量数据,模仿人体如何将感官观察传递到大脑。他们的 Transformer,就像我们的大脑一样,可以成功地处理无序的信息流。

「神经网络天生就接受特定的输入。」Tang 说。但在现实生活中,数据集往往变化很快,大多数 AI 没有办法调整。「我们想试验一种可以很快适应的架构。」

尽管有这些进步的迹象,Behrens 认为 Transformers 只是迈向准确的大脑模型的一步,而不是探索的终点。「我在这里必须是一个怀疑的神经科学家。」他说,「例如,我不认为 Transformers 最终会成为我们在大脑中思考语言的方式,即使它们拥有当前最好的句子模型。」

「这是预测我在哪里以及接下来会看到什么的最有效的基础吗?老实说,现在说还为时过早。」Barry说。

Schrimpf 也指出,即使是表现最好的转换器也是有限的,例如,在单词和短语方面表现良好,但在讲故事等更大规模的语言任务中却不适用。

「我的感觉是,这种架构,这种 Transformer,让你进入正确的空间来理解大脑的结构,并且可以通过训练得到改善。」Schrimpf 说,「这是一个很好的方向,但这个领域超级复杂。」

相关报道:https://www.quantamagazine.org/how-ai-Transformers-mimic-parts-of-the-brain-20220912/

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)大脑研究计划,构建互联网(城市)大脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。每日推荐范围未来科技发展趋势的学习型文章。目前线上平台已收藏上千篇精华前沿科技文章和报告。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

e9a7c8ed6786407c4d177dcc94fbd374.jpeg

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/58763.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

攻防世界_Crypto_告诉你个秘密

攻防世界刷题记录Crypto篇 文章目录 攻防世界刷题记录Crypto篇解题步骤1.下载题目附件查看内容2.借助Python来解码3.从键盘上找到每组字母包围的字母 解题步骤 1.下载题目附件查看内容 如图所示,题目附件给出的是一个txt文件里面有两行字符串。因为只有不超过F的大…

来自Transformer + Bert + GPT 的灵魂拷问

Transformer Q:Transformer如何解决梯度消失问题的? A:残差连接 Q:为何Transformer中使用Layer Normalization而不用Batch Normalization? A:BatchNorm是对一个batch-size样本内的每个特征做归一化,LayerNorm是对每…

基于tkwinter制作的exe小工具

前言 最近事没那么多,然后同事基于tkwinter制作了一款exe造单工具,感觉挺好玩的,然后叫同事分享了一下源码,自己去学习了tkwinter各大组件的相关语法及操作,所以写篇博客分享一下 同事款工具 下面是同事写的小工具&…

【WAX链游】发布一个免费开源的Alien Worlds【外星世界】合约脚本TLM

前言 《链游Farmers World【农民世界】爆火,发布一个免费开源的脚本》 在之前的文章中,我们分享了一个开源的农民世界(Farmers World)脚本 【OpenFarmer】:https://github.com/encoderlee/OpenFarmer 经过这段时间以来的不断学习&#xff…

量子计算机细思极恐,宇宙或许只是一套虚拟程序,科学家:还有一种可能细思极恐!...

原标题:宇宙或许只是一套虚拟程序,科学家:还有一种可能细思极恐! 我不知道你是否有过类似的经历:刚从沉睡中醒来,你周围的世界就有一种奇怪的虚幻和朦胧感,当意识浮出水面,你周围的事物就回到了…

【电力电子技术速通】五、DC-DC变流电路(一)Buck与Boost

一、概述 直流-直流变流电路也称斩波电路,并且斩波这种叫法更多一些。 可以分为直接直流变流电路和间接直流变流电路,最大的区别就是后者是隔离式的,通常用高频变压器隔离,所以也叫直-交-直电路。 斩波电路的三种控制方式&#…

TrickBot和Emotet再夺恶意软件之冠

根据Check Point Software的最新分析,僵尸木马TrickBot和Emotet是10月份最流行的恶意软件,这一趋势将推动勒索软件感染的激增。 Check Point通过ThreatCloud威胁情报系统传输的数据编制了2020年10月的全球威胁指数,据说该系统每天检查超过25亿…

元宇宙,会成为下一代互联网的主场吗?

导语 | 2022 年元宇宙风靡全网,作为过去一年科技界的“当红扛把子”,引多家科技巨头“竞折腰”。近日,《福布斯》双周刊网站在报道中指出,2030 年全球元宇宙的市场规模有望高达 5 万亿美元,2023 年可能是确定其发展方向…

必然还是炒作?从技术发展来看元宇宙

关于元宇宙,已经成为了2021年一个大火的名词,国外的Facebook(现Meta)、微软、英伟达……国内的腾讯、阿里、字节跳动……各大互联网巨头纷纷入局,甚至在11月12日,中国电信也表示将在2022年启动打造元宇宙基…

元宇宙持续火热的背景下,我们普通人如何赚钱

放眼全球,最近几年,能让互联网大厂像扑了蛾子一般向前冲的风口除了区块链、智能电动汽车,就是元宇宙。 尤其那些在区块链上没有吃到什么红利,造车运动又没参与上的互联网企业,对元宇宙似乎有一种执念。 这种执念让一…

即将到来的2023,国内元宇宙开始“割”企业了?

元宇宙爆火一年后,UTONMOS即将成为全球化全部实现ERC-721协议NFT链上垂直游戏价值生态的系统平台,旨在通过利用自身所拥有的各类头部资源和游戏化打造内容层的融合,建立一个元气满满的元宇宙Web3.0平台。 通过数字藏品技术的应用&#xff0c…

元宇宙将如何影响我们的投资、就业和生活方式?

【导读】 3月10日,Roblox在纽交所上市,成为元宇宙概念第一股,首日股价上涨54%,市值超过400亿美元。近日,Facebook创始人兼CEO扎克伯格表示,要在五年左右的时间里,将Facebook从一家社交媒体公司…

元宇宙热潮:缘起、影响与展望

当下科技界和产业界最热的话题非“元宇宙”莫属。2021年3月,“元宇宙第一股”美国网络游戏和社交平台公司Roblox在纽约证券交易所上市。10月,美国互联网巨头Facebook更名为“元”(Meta),宣告其强势进军元宇宙相关产业。…

2023年JDK要升级到多少?看看七家大模型给的答案

前言 在2023年很多公司应该还在用JDK8,目前JDK已经更新到JDK20,JDK21也将在2023年9月发布,那么在2023年如果我们要升级JDK,到底升级到哪个版本比较合适呢?这个问题我们可以交给大模型,看看各家大模型是怎么…

数据分析师的职场晋升

数据分析师怎么晋升?数据分析师的优势在哪?数据分析师的护城河在哪? 以上三个问题我相信很多数据相关的同学都有疑问。对于我(螺丝钉)来说,工作8年,现任数据负责人。分别做过SRE,数据运营和经营分析&#…

行业大洗牌,一大批数据分析师要失业了

数据分析师的尴尬处境 前段时间,我一个前同事离职了——他有4年的数据分析经验,却被强行安排到了运营部做数据日报,心态崩了。 我自己也是老数据分析师了,还是很理解这其中的苦衷。 论业务能力比不过运营,论技术水平比…

数据分析火了,数据分析师失业了

在一次演讲中,马云又爆出金句,说:做数据分析未来会找不到工作,因为未来的数据一定不是用脑子算,而是用机器。 虽然 Teacher 马向来有语不惊人死不休的习惯,但这句话并不是空穴来风—— 随着数据工具越来越先…

科大讯飞语音识别测试

下载官方Java SDK,获取到核心jar包 新建工程,将核心jar包导入项目工程中 将SDK中文件同样复制到项目工程中 核心测试代码: package com.iflytek;import com.iflytek.cloud.speech.*; import com.iflytek.util.JsonParser;/*** program&…

怎么彻底删除聊天记录?几种适合的办法交给你!

微信官方回应称,微信不会储存用户的聊天记录,尊重用户隐私一直是微信最重要的原则之一,没有权限、也没有理由去看用户的聊天内容。而电影里的007电影,传输消息之后,手机或者电脑都会启动自毁程序。防止消息泄露。不过这…

Telegram支持删除双方设备中的聊天记录

以保护隐私而享誉全球的开源即时通讯工具 Telegram(电报)近日增加了一项新功能——允许用户在一对一聊天中删除任何消息,重点是支持从聊天双方的设备中删除。两年前 Telegram 首次引入"unsend"功能时,用户可以删除他们自…