DeepMind一直是谷歌的骄傲。
作为谷歌母公司Alphabet的子公司,DeepMind是世界领先的人工智能实验室之一。成立13年,它交出的成绩单,十分亮眼。
不得不说,DeepMind在算法上是有点东西的。
2022年7月,AlphaFold大爆。2022年10月,DeepMind研发的AlphaTensor登上了自然杂志封面,这是第一个用于为矩阵乘法等基本计算任务发现新颖、高效、正确算法的AI系统。
现在,所有人都意识到了,AI正处于时代的「风口浪尖」。
ChatGPT虽然写作能力媲美人类,但很难规避掉训练数据中的错误信息和有毒偏见。更可怕的是,现在计算能力已经变得越来越低廉,AI对普通大众的门槛越来越低。
DeepMind CEO Demis Hassabis对AI发展的趋势感到担忧,他担心,AI会被用于制造可怕的工具,破坏人类的文明。
不过,也有网友吐槽,「我很欣赏他的立场,但是当竞争对手试图尽可能快地朝着同一个目标前进时,这些AI开发公司怎么能不加快行动呢?」
还有网友说,他是想为追赶OpenAI争取时间hhhhhh。
DeepMind的使命——构建通用人工智能AGI
接下来就让我们看看,Hassabis在这次的对话中,都透露了哪些重要信息。
时代杂志专栏记者BILLY PERRIGO采访了Deepmind CEO兼创始人Demis Hassabis,探讨了DeepMind的使命,以及如何构建AI,从而解决一些世界上最棘手的问题。
Demis Hassabis站在螺旋楼梯的中间,审视着他建造的大教堂,这座跨越三层楼的DNA雕塑是DeepMind最近开设的伦敦总部的核心
46岁的Hassabis一直致力于解决关于AI的永恒问题:
AI是什么?其中埋藏着哪些可能性?人类如何从中获取更多能力?
Hassabis说他的团队一直在努力实现一个更宏伟的目标:
这个目标是构建一个能够自主思考、学习并解决人类最棘手问题的机器来实现通用人工智能(AGI)。
今天的人工智能是狭隘的、脆弱的,而且根本不算智能。
Hassabis认为,AGI将成为一种划时代的技术,就像电力的利用一样改变人类生活的结构。
就连他自己也把推特主页的签名改成了「致力于AGI,尝试了解现实的基本性质」。
但人工智能的前景也伴随着风险。
研究人员构建的设计新药的AI程序可以很容易制造出致命的生化用品,大规模训练的AI模型可能被仇恨言论者利用。
OpenAI开发的爆款ChatGPT因其容易受到种族主义和错误信息的影响而受到批评,小公司Prisma Labs也是如此,许多用户抱怨Lensa将他们的图像性感化,暴露出其训练数据中的偏见。
Prisma Labs开发的AI增强自拍软件——Lensa
正是在这种不确定的气氛中,Hassabis同意接受这次的采访,就他日益增长的担忧发出严厉警告,「我建议放缓AI前进的速度,至少不要太快」。
就像Facebook用户数量飙升至30亿之时,大家都在欢呼雀跃,但当虚假信息、仇恨言论甚至煽动种族灭绝开始出现在平台上时,也让公司措手不及。
Hassabis看到了人工智能发展的令人担忧的趋势,他说:
人工智能现在正处于风口浪尖,能够制造出可能对人类文明造成严重破坏的工具,并敦促他的竞争对手比以前更加谨慎,但大多数人并没有意识到其中存在的危险性。
从国际象棋手到搅动风云的CEO
和其他同龄人不太一样,Hassabis12岁时就已经是世界排名第二的国际象棋棋手,并提前一年从高中毕业。
Hassabis(左)9岁时担任英格兰11岁以下国际象棋队队长
他还在初中时就已经开始思考那些改变人类历史的大问题,他说:
我想理解那些大问题,那些通常会与哲学或物理学领域相关的大的话题,我认为构建AI将是回答其中一些问题的最快途径。
Hassabis走进Guildford的Bullfrog视频游戏工作室时只有15岁。
他还参加了一家电子游戏杂志的比赛,以赢得在著名工作室实习的机会,他设计的一个太空侵略者风格的游戏还获得了当季销售量第二的成绩。
Bullfrog的联合创始人Peter Molyneux仍然记得第一次见到Hassabis的样子,莫利纽克斯说:
他看起来像指环王里的精灵,这是一个从他身边走过,甚至都不会注意到的小孩子,但他的眼中闪烁着智慧的光芒。
在去Bullfrog的圣诞晚会的公交车上一次偶然的谈话中,这位少年迷住了Molyneux。
他们谈到了游戏的哲学,是什么让胜利如此吸引人,以及你是否可以将这些相同的特征灌输到机器中,那时他就知道这个年轻人注定要成就大事。
边读博,边进军游戏圈
从剑桥大学毕业后,Hassabis回到Bullfrog帮助Molyneux开发了他迄今为止最受欢迎的游戏:Theme Park,一款玩家从上帝视角经营游乐场业务的模拟游戏。
在决定攻读神经科学博士学位之前,Hassabis继续建立了自己的游戏公司。
他想了解大脑的算法层面:不是微观神经元之间的相互作用,而是似乎产生人类强大智能的更大结构。
思想是宇宙中最难以捉摸的事物,从象棋到游戏再到神经科学,我一生的经历和职业轨迹都为了发现其中的奥秘。
2013年,DeepMind成立第三年,谷歌来敲门了。
一群谷歌高管乘坐私人飞机飞往伦敦,Hassabis向他们展示了团队的作品——训练玩电脑游戏Breakout的AI原型,这让他们惊叹不已。
DeepMind算法背后的标志性技术——强化学习(Reinforced Learning),是谷歌当时没有做过的事情。
它的灵感来自人脑的学习方式,这是Hassabis在他作为神经科学家期间形成的一种理解。
AI在游戏中的数百万次训练,每次得分都会得到奖励,并通过基于点的强化过程学习最佳策略。
Hassabis和他的同事们坚信在游戏环境中训练人工智能,这种方法的好处给谷歌高管留下了深刻的印象。
「我立刻就爱上了他们,」领导这次考察之旅的谷歌前高级副总裁Alan Eustace说。
目前,Hassabis最爱的一款游戏名为Polytopia。在这款策略游戏中,玩家的目标是通过技术进步,将一个小村庄发展成为一个统治世界的帝国。
Hassabis说,马斯克也是这款游戏的粉丝。两人最后一次交谈是在几个月前,主要聊的就是Polytopia。
虽然Hassabis为人谨慎,但很容易理解,为什么游戏能与他产生共鸣。他仍然相信技术进步本质上对人类有益。而在资本主义制度下,预测和减轻AI的风险是可能的。「科学和技术的进步,这就是文明的驱动力,」他说。
被马斯克抛弃
但就在DeepMind不断攀登新高度的时候,事情开始变得复杂起来。
2015年,其最早的两位投资者,亿万富翁彼得·泰尔和埃隆·马斯克,通过资助竞争对手初创公司OpenAI象征性地背弃了DeepMind。
该实验室随后获得了微软10亿美元的资助,它也相信AGI的可能性,但对于如何实现这一目标有着截然不同的理念。
它对游戏没那么感兴趣。它的大部分研究都不是集中在强化学习上,而是集中在无监督学习上,这是一种不同的技术,涉及从互联网上抓取大量数据并将其通过神经网络抽取。
当DeepMind、谷歌和其他AI实验室一直在闭门进行类似研究时,OpenAI更愿意让公众使用其工具。
2022年,DeepMind推出了DALL·E 2,可以生成几乎任何可以想象到的搜索词的图像,以及聊天机器人ChatGPT。由于这两种工具都是根据从互联网上收集的数据进行训练的,因此它们受到结构性偏见和不准确的困扰。
DALL·E 2很可能将律师描绘成白人老头,将空姐描绘成年轻美女,而ChatGPT则容易自信断言虚假信息。
但是,尽管Hassabis呼吁放慢AI竞赛的步伐,但DeepMind似乎也未能幸免于竞争压力。
2022年初,该公司发布了更快引擎的蓝图。这项名为Chinchilla的研究表明,许多业界最前沿的模型训练效率低下,并解释了它们如何能够以相同水平的计算能力提供更多功能。
Hassabis说,DeepMind的内部道德委员会讨论了发布研究是否不道德,因为它可能会让不那么谨慎的公司在没有严格保护的情况下发布更强大的技术。
人工智能巨头的道德红线
置身其中,Hassabis深知人工智能可能产生的危险。
「他明白AI技术对社会影响深远,他想在技术发明之前就能有所了解,」Eustace说。「这就像国际象棋。如何面对残局?如何预测二十步之后的发展?」
Eustace向Hassabis承诺,谷歌也有同样的担忧,两者之间的利益一致。Eustace说,谷歌的使命是索引所有人类的知识,使之易于访问,并最终提高世界的智商。
谷歌前高级副总裁Alan Eustace
「我认为这引起了他的共鸣。」2014年,谷歌以约5亿美元的价格收购了DeepMind。Hassabis拒绝了来自Facebook的更高报价。
他说,其中一个原因是,与Meta不同,谷歌「非常乐意接受」DeepMind划定的道德红线。
Hassabis希望,DeepMind成为Al研究中安全和道德的代表。以身作则,在这个充满追求更快更强的领域做好自己。
DeepMind发布了反对不道德使用其技术(包括监视和武器化)的「红线」。但它却没能阻止母公司谷歌,使用自己搭建的AI系统,和五角大楼进行科技合作。
2021年,Alphabet结束了与DeeMind长达数年的谈判。根据谈判结果,DeepMind将保持其在Alphabet的现有地位,其未来工作将由谷歌高级技术审查委员会监督,其中包括两名DeepMind高管。
Hassabis并不否认DeepMind的「逃离谷歌」计划,但没有表示自己对公司目前架构的担忧。
但他补充说,自收购以来,DeepMind的道德结构已经「演变为现在的样子」。
Hassabis说,DeepMind和Alphabet都致力于公共道德框架,并从一开始就将安全纳入他们的工具。
DeepMind有自己的内部道德委员会,即机构审查委员会(IRC),由公司所有部门的代表组成,首席运营官Lila Ibrahim担任主席。
DeepMind首席运营官Lila Ibrahim
Ibrahim说,IRC定期举行会议,任何分歧都会升级到DeepMind的执行领导人做出最终决定。她说,「我们的运作十分自由,有一个单独的审查流程。」
当被问及如果DeepMind的领导团队不同意Alphabet高层的决定,或者公司的道德「红线」被越过会发生什么时,Ibrahim说:「我们还没有遇到这个问题。」
AlphaGo:震惊世界的人机大战
在DeepMind总部大厅远处墙壁的玻璃柜中,放着一块涂有黑色涂鸦的大方形木头。
这是DeepMind第一次重大成功的纪念品。谷歌收购后不久,该公司就为自己设定了挑战,即设计一种算法,在围棋中击败世界上最好的棋手。
当时,国际象棋早已被蛮力计算机编程所征服,但围棋要复杂得多;最好的人工智能算法仍然无法与顶级人类玩家相提并论。
DeepMind以破解Breakout的方式解决了这个问题。它建立了一个程序,在通过观察人类游戏来学习游戏规则后,它可以与自己进行数百万次模拟对战。
通过强化学习,算法会自我更新,减少使其更有可能输掉比赛的决策的「权值」,并增加使其更有可能获胜的「权值」。
2016年3月,名为AlphaGo的算法与世界顶级围棋选手之一李世石对决。AlphaGo以四比一击败了他。败北的李用黑色记号笔在棋盘背面潦草地签下了自己的签名。
2016年,Hassabis在韩国庆祝DeepMind战胜围棋选手李世石(右)
AGI驱动的未来会是乌托邦吗?
Hassabis认为,如果AGI创造财富的时代已经到来,那么这些财富应该重新得到分配。「我认为我们需要确保尽可能多的人受益——最好是全人类。」
他喜欢全民基本收入(universal basic income)的想法。在理念下,每个公民每月都会从政府那里获得津贴和基本服务。同时,国家会保障公民交通或住房等基本生活水平。
Hassabis说,AGI驱动的未来应该比当今世界更加注重财富平等,但他没有解释该系统将如何运作。
「如果我们生活在一个极度富足的世界,那么留给不平等的空间也越小,不平等产生的概率也会更低。因此,如果AGI的愿景得以实现,这就是它的积极影响之一。」
然而,鉴于过去几十年,科技行业极速增长与财富不平等的大幅加剧同时发生,其他人对这种乌托邦式的未来并没有那么乐观。
播客节目Tech Won't Save Us的主持人Paris Marx说:「大公司,包括DeepMind的母公司,首要任务是确保为股东创造最大价值。
如果不能获利,这些公司根本不会专注于解决气候危机。当公司的全部目标是为股东积累更多财富时,他们肯定对重新分配财富不感兴趣。」
「我们缺乏的不是解决气候危机或重新分配财富的技术,」Marx说。「我们缺乏的是政治意愿。目前来说,很难看出一项新技术的诞生将如何产生政治意愿,从而实现真正的社会转型。」
说回DeepMind的螺旋楼梯,楼梯中间,摆放着一个巨大的DNA雕塑。雕塑前的木凳上有一个告知:「请勿触碰,」上面写着。「它非常脆弱,很容易损坏。」
参考资料:
https://time.com/6246119/demis-hassabis-deepmind-interview/
https://www.youtube.com/watch?v=Gfr50f6ZBvo