整理 | 褚杏娟,核子可乐
谷歌在上个月的开发者大会上公布了一系列 AI 新项目,当时首次亮相的 Gemini 曾受到不少嘲讽。但近日,DeepMind 联合创始人兼 CEO Demis Hassabis 自曝,工程师们正在使用 AlphaGo 的技术来开发 Gemini,其强大程度有望超越 OpenAI 的当家花旦 ChatGPT。
在 AlphaGo 的加持下,Gemini 瞬间备受关注。在 2016 年,谷歌 DeepMind 人工智能实验室打造的 AlphaGo 程序成功击败围棋世界冠军,写下了 AI 发展史上的一页新篇章。
仍在开发当中的 DeepMind Gemini 是一套专门处理文本的大语言模型,其本质与 ChatGPT 家族的 GPT-4 相似。根据此前的介绍,Gemini 一开始就以多模式、高效的工具和 API 集成为目标而创建,旨在支持未来的创新,例如内存和规划。经过微调和严格的安全测试后,Gemini 将提供各种尺寸和功能。
现在,Hassabis 表示,他的团队将 GPT 技术与 AlphaGo 的特性加以结合,希望赋予系统规划和解决问题的新能力。“从宏观来讲,大家可以把 Gemini 理解为结合了 AlphaGo 系统优势与大模型令人惊叹的语言能力。我们还做出了其他非常有趣的创新。”
之前谷歌开发者大会上,谷歌 CEO Sundar Pichai 也说道,“虽然还为时过早,但我们已经看到了之前型号中未曾见过的、令人印象深刻的多模式功能。”
DeepMind: 下一代大模型碾压 GPT-4要训练出 OpenAI GPT-4 这样的大语言模型,研究人员需要将书籍、网页和其他来源处的大量精选文本输入到 Transformer 机器学习软件当中。模型会利用训练数据中表现出的模式,熟练预测一段文本之后应该出现的一个个字母和单词。这种简单的文本预测机制在回答问题、生成自然语言 / 代码方面被证明拥有强大的潜力空间。
要进一步开发 ChatGPT 及类似功能的语言模型,DeepMind 认为还有另一个重要的附加步骤,就是使用基于人类对 AI 模型答案做出的反馈,进而借助强化学习提高其性能。DeepMind 在强化学习方面的丰富经验,也许能让研究人员为 Gemini 赋予更多新颖能力。
AlphaGo 基于 DeepMind 首创的强化学习技术。这项技术要求 AI 模型在问题之上反复尝试并接收关于性能的反馈,据此设计接下来将要采取的行动(例如围棋或电子游戏),从而让软件一步步学会解决棘手问题。它还采用所谓“树搜索”方法,以探索并记住棋盘上可能采取的各种动作。如果这一思路能够帮助语言模型迎来下一次重大飞跃,则新 AI 或能在互联网和计算机上执行更多种类的任务。
Hassabis 和他的团队也许还会利用 AI 领域的其他思路继续增强大语言模型。DeepMind 研究人员的关注领域涵盖机器人、神经科学等诸多方向。本周早些时候,该公司展示了一种算法,能够学习借助不同类型的机械手臂完成操作任务。
人们普遍认为,跟人类和其他动物一样,AI 的能力提升也需要从现实世界中学习客观经验。一部分 AI 专家相信,语言模型的最大限制就是只能通过文本以间接方式了解世界。
Hassabis 坦言,Gemini 目前仍在开发当中,且整个过程需要几个月时间,成本则在数千万到数亿美元之间。OpenAI 公司 CEO Sam Altman 曾有 4 月表示,GPT-4 的开发成本超过了 1 亿美元。
Hassabis 的任务就是加快谷歌的 AI 开发进度,同时管理种种未知的潜在风险。最近一段时间,语言模型的快速进步已经令 AI 专家(包括部分算法专家)感到担忧,害怕这项技术被恶意滥用或者变得难以控制。某些内部技术人士甚至呼吁暂停开发更强大的算法,避免匆忙之中造成重大威胁。
Hassabis 认为,AI 技术的确拥有巨大的潜在助益,例如在健康或气候等领域推动科学发现,所以人类探索 AI 的脚步绝不能停止。但他也强调,强制叫停研究明显脱离实际,基本没有可行性。“只要处置得当,AI 将成为有史以来对人类最有益的技术成果。我们必须有勇气去追求这样的关键成果。”
这也不是说 Hassabis 在一味强调快速开发 AI 技术。DeepMind 早在 ChatGPT 出现之前,就一直在探索 AI 可能带来的各种风险。该公司联合创始人之一 Shane Legg 多年来一直领导一支内部“AI 安全”小组。Hassabis 上个月与其他备受瞩目的 AI 领袖一道签署了一份声明,警告称 AI 也许有一天会引发与核战争或全球流行病相当的严峻风险。
Hassabis 强调,目前最大的挑战之一就是确定更强的 AI 具体会带来哪些风险。他解释道,“我认为 AI 领域需要在评估测试等方面开展更多研究——这已经是一项非常紧迫的任务”,用以确定新 AI 模型的能力和可控性。为此,DeepMind 可能会逐步向外部科学家开放自己的系统。“希望学术界能够尽早接触到这些前沿模型。”如果此观点得到落实,也许有助于解决科技巨头以外的 AI 专家被排除在最新研究之外的担忧。
那我们究竟要不要为 AI 大爆发这样一个未来而担忧?Hassabis 安慰道,其实没人真能确定 AI 会不会成为一种重大威胁。但他相信,如果 AI 研究继续以目前的速度推进,那业界确实没什么时间制定相应的保障措施。“我能切身观察到我们在构建 Gemini 时的一步步进展,相信这些成果都将发挥预期当中的作用。”
OpenAI: 入驻 DeepMind 大本营自从 ChatGPT 去年惊艳亮相以来,谷歌很快推出了自己的聊天机器人 Bard,并将生成式 AI 技术应用至搜索引擎及其他众多产品当中。为了增强 AI 研究力度,谷歌公司还于 4 月将 Hassabis 领导的 DeepMind 部门与谷歌另一 AI 实验室 Brain 合并,建立起一个新的谷歌 DeepMind。Hassabis 表示,新团队将汇聚双方最近一段时间为奠定 AI 基础所积蓄的强大力量。“纵观我们在 AI 领域的进展,就会发现 80% 到 90% 的成果都来自这两支队伍。过去十年间,双方也都取得过辉煌的成就。”
Hassabis 本人曾经凭借 AlphaGo 掀起过一波 AI 热潮。所以面对如今这轮技术巨头争相投入的 AI 淘金之风,他显得颇有经验。但另一方面,其竞争对手 OpenAI 的扩张脚步也在继续。
几乎在同一时间,OpenAI 宣布,将在伦敦开设其第一个国际办事处。OpenAI 首席执行官 Sam Altman 表示,当 OpenAI 伦敦办事处将专注于提升“研究和工程能力”,同时平衡与“当地社区和政策制定者”的合作。
值得注意的是,伦敦是谷歌最大的人工智能研究部门 DeepMind 的长期总部基地。鉴于伦敦拥有著名的大学和丰富的学术历史,伦敦也是数据科学人才的源泉。OpenAI 这次海外扩张,将与谷歌在同一个城市近距离竞技。
自 2015 年成立以来,OpenAI 一直没有扩展到旧金山总部以外的地方。Altman 在一份声明先中表示,这次扩张是一次吸引世界级人才的机会。据报道,Altman 也提出将波兰和法国作为该办事处的替代选择。其中,法国也被视为人工智能领域的领导者,谷歌和 Meta 都在巴黎设立了人工智能实验室。
此时,正值 OpenAI 致力于创造利润之际。运行人工智能基础设施并不便宜,半导体研究公司 Semianalysis 层估计 OpenAI 每天的成本约为 700,000 美元。考虑到这一点,英国的企业税比美国和其他欧洲国家低。
广义上讲,伦敦也正在成为人工智能初创企业蓬勃发展的中心。根据最近的一份报告,截至 2021 年,伦敦有超过 1,300 家人工智能公司,就风投资金而言,伦敦也是英国资金最多的城市。
对于 OpenAI 等大量投资人工智能的科技公司来说,伦敦也有很重要的政治地位,这些公司试图说服英国管理机构对人工智能进行宽松的监管。
在最近的一次游说之旅中,Altman 出现在伦敦大学学院,并呼吁“平衡”监管。Altman 威胁称,如果公司无法满足欧盟目前正准备出台的新人工智能(AI)立法规定,OpenAI 可能会“停止在欧盟的运营”。据悉,该法案是人工智能行业第一套综合法规之一。后来,Altman 收回了这些评论。
有趣的是,DeepMind 创始人中的 Demis Hassabis 和 ShaneLegg 就是相识于伦敦大学学院生命科学系的盖茨比计算神经科学小组。
如今,OpenAI 在伦敦的办事处正在大量招聘,涉及各类研发、政策安全等岗位,是否会引发人才流动还未可知。但可以预见,OpenAI 与 谷歌 DeepMind 之间的竞争将会愈发激烈。
参考链接:
https://www.wired.com/story/google-deepmind-demis-hassabis-chatgpt/
https://techcrunch.com/2023/06/28/openai-brings-the-competition-to-deepminds-doorstep-with-new-london-office/
活动推荐OpenAI 推出的 ChatGPT 带来了革命性的变化,整个 IT 生态面临大模型(LLM)的洗牌和洗礼。在这个过程中,架构师、工程师会遇到前所未有的挑战和机遇。
在 7 月 21 - 22 日深圳站 ArchSummit 架构师峰会上,我们邀请了出门问问工程 VP 李维博士来会议现场分享最新的研究成果。让你放下焦虑,找到解决思路。点击「阅读原文」查看专题详情。