微软和 OpenAI 在 LLM 竞争中脱颖而出
过去几周,微软、OpenAI、谷歌和其他组织发布了重大人工智能公告。科技公司正争先恐后地巩固其在快速扩展的大型语言模型 (LLM) 和生成 AI 市场中的地位。
随着大型科技公司继续向该领域投入更多资金,微软和谷歌之间的竞争逐渐两极分化。到目前为止,微软已经证明在让 LLM 的生成式机器学习模型在其产品中发挥作用方面更加巧妙和更有能力。但比赛还没有结束,我们可能还会看到谷歌(或其他公司)取得领先。
GitHub Copilot 获得升级
GitHub Copilot 是大型语言模型(LLM)最成功的应用之一。它具有很好的产品/市场契合度。它很好地解决了生成代码的问题,足以让开发人员选择它而不是替代品。开发人员无需通过 Stack Overflow 和其他论坛来寻找解决方案,而是向 Copilot 提供描述,然后它会为他们生成代码。
GitHub Copilot 的成功取决于 LLM 的正确实施。它的基础模型是Codex,这是一个 OpenAI LLM,已经在大量源代码上进行了训练。生成代码时,它使用当前文件的现有源代码作为上下文。这有助于提高其输出的准确性并减少其错误。
Copilot 为开发人员提供了极大的生产力提升和改进的用户体验。GitHub Copilot 的附加值足以让开发者和公司愿意为之买单。
现在,GitHub 推出了其 AI 编程助手的升级版Copilot X。GitHub Copilot X 超越了自动完成并添加了新功能。主要添加的是一个类似 ChatGPT 的助手,可帮助您调试代码、解释错误消息和分析现有代码。LLM 无缝地使用现有代码和突出显示的片段作为上下文来改进其建议和输出。GitHub 还添加了一些巧妙的特权,例如直接将建议的代码插入当前文件。
将会有更多的功能,例如自动建议“开发人员通过动态提取有关代码更改的信息来创建拉取请求时的句子和段落”。
另一个即将推出的功能是 Docs 的 Copilot,LLM 将帮助开发人员浏览不同编程框架的文档。开发人员可以将 Copilot 配置为根据他们对相关主题的了解来调整其输出。此功能目前适用于已知的文档源,例如 React 和 Azure Docs。但 GitHub 计划将此功能添加到自定义文档源中。
Microsoft 365 获得 AI Copilot
在 GitHub Copilot 成功的支持下,微软决定为其 365 应用程序发布 Copilot。Microsoft 365 Copilot 是将 LLM 集成到现有应用程序中的另一个有趣示例。
它可以帮助在 Outlook 中撰写电子邮件,在 Word 和 PowerPoint 中起草和修改内容,以及在 Excel 中分析数据。它还可以执行业务级任务,例如总结 Teams 中的讨论点,以及从公司数据中生成见解。微软还将 Copilot 集成到 Power Platform 中,帮助自动化业务任务。据微软称,它还应该“学习新技能”。
根据微软博客,Copilot 汇集了 LLM、Microsoft 365 应用程序和 Microsoft Graph。Graph 作为一种语言模型增强工具,为来自整个企业的信息提供 API 接口。
ChatGPT 获取外部插件
到目前为止,LLM 的力量主要是通过与应用程序的集成来体验的。
然而,另一种方法是将应用程序集成到人工智能中。
一个例子是ChatGPT 的新插件功能。这些插件通过外部知识来源(例如 Wolfram Alpha、Bing、OpenTable 和 Instacart)增强了 LLM。
当ChatGPT收到提示时,它会使用这些应用程序来获取最新信息,而不是局限于其训练数据。这些插件还可以让 ChatGPT 在这些应用程序中采取行动。
虽然检索增强可以帮助解决 LLM 的一些挑战,例如他们的幻觉问题。
“人工智能中的应用程序”的更大含义可能是应用程序的范式转变。ChatGPT 等聊天机器人界面可以成为应用程序的新门户。用户将不再打开应用程序,而是将更多时间花在 ChatGPT 中来解决他们的问题。这可能会引发新一波为与 LLM 集成而构建的应用程序。
现在判断该领域是否已为这种转变做好准备还为时过早。这将取决于增强 LLM 的稳健性、可靠性和便利性。根据 OpenAI 的说法,“插件可能会通过采取有害或意外的行动来增加安全挑战,从而增加欺诈、误导或滥用他人的不良行为者的能力。通过增加可能的应用范围,插件可能会增加因模型在新领域中采取的错误或未对齐的操作而产生负面后果的风险。”
谷歌发布巴德
在 OpenAI 发布GPT-4后不久,谷歌宣布了Bard,它是 ChatGPT 的竞争对手。巴德在 2 月份有一个最初的失败演示。但它现在已经准备好迎接黄金时段,在美国和英国可以使用候补名单。
Bard 旨在提供 LLM 聊天和 Google 搜索之间的无缝体验。它不提供像 ChatGPT 和 Bing 那样的代码生成。谷歌的行动非常谨慎。它的常见问题解答中充满了诸如此类的通知:
“巴德是实验性的,有些回答可能不准确,所以请仔细检查巴德回答中的信息。”
“巴德的回应也可能偶尔声称它使用来自 Gmail 或其他私人应用程序和服务的个人信息。”
“巴德掌握上下文的能力目前是有意限制的。”
但谷歌也很快指出,它发明了transformer 架构,这是 LLM 中使用的架构。
乍一看,谷歌似乎落后于微软/OpenAI。实验表明,Bard 不如 ChatGPT 和 Bing,并且缺少几个功能。但现在宣布比赛还为时过早。谷歌是一家非常富有和足智多谋的公司,它正在采取措施加强与微软的对抗。
LLM 竞赛的下一步是什么?
谷歌和微软之间日益激烈的竞争令人担忧。他们急于为 LLM 和生成式 AI 抢占更大的市场份额,他们冒着将该领域推向更少共享和透明度的风险。微软、谷歌、OpenAI 和其他公司越来越不愿意向公众发布他们的模型。GPT-4 技术报告中关于该模型的详细信息比其前身更少。开放性正在换取商业优势。
然而,并非一切都是严峻的。还努力创建开源 LLM 以保持该领域的民主化。Meta 的LLaMA和OPT-175B、Hugging Face 的BLOOM和 Stanford 的Alpaca都是例子。
该领域的发展速度确保了这一年将有更多的成就。
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/47947.html
如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!