AI新风向标PaLm2?
前几天Google发布了,PaLM2作为Google的下一代大型语言模型,它会取代ChatGPT成为更智能的AI工具吗?
关于PaLM2
PaLM 2是Google的下一代大型语言模型,它建立在谷歌在机器学习和负责任的人工智能方面的突破性研究遗产之上。
擅长于高级推理任务,包括代码和数学、分类和问答、翻译,以及自然语言生成,比我们以前最先进的大型语言模型(包括PaLM)更好。它之所以能够完成这些任务,是因为它的构建方式——将计算最优缩放、改进的数据集混合和模型架构改进结合在一起。
PaLM 2能做什么
数学、高级推理、多语言翻译、编译代码
PaLM 2模型不同于之前所构建的,其非常擅长数学、编码、高级推理、多语言翻译,它之所以能实现这些因为基于数学数据和科学所训练的,并且接受大约100种口语语言和20多种编程语言的训练 ,目前PaLM 2已经在Bard、Google Workspace、PaLM API中种使用。
编译代码的翻译与转换
PaLM 2不止可以翻译口语语言还口语翻译编程语言,(Python转JAVA,或者R转Go),当然目前还不支持用中文提问。
再转换为R语言
其中介绍一段PaLM 可应用使用PaLM 2与代码库中的同事写作,该代码库都以其他语言实现,当然依旧不支持转中文
As an LLM, I am trained to understand and respond only to a subset of languages at this time and can't provide assistance with that. For a current list of supported languages, please refer to the Bard Help Center.
作为一大型语言模型,我接受的训练是只能理解和回应一小部分语言,无法提供帮助。有关当前支持的语言列表,请参阅Bard帮助中心。
翻译为英语
不难发现在原有基础上,它添加了便于理解的注解,以及控制台的输出语句
试了一下西班牙语也是可以的,世界三大语言支持两种,唯独不支持全球使用量最多的语言,这点确实有点没头绪
编译代码
PaLM2是如何构建和评估的
由于它的构建方式,PaLM 2在高级推理、翻译和代码生成等任务上表现出色。它通过在大型语言模型中统一三个不同的研究进展,改进了它的前身PaLM:
使用计算最优缩放:
计算最优缩放的基本思想是按比例缩放模型大小和训练数据集大小。这项新技术使PaLM 2比PaLM更小,但效率更高,总体性能更好,包括更快的推理、更少的服务参数和更低的服务成本。
改进的数据集混合:
以前的大型语言模型,如PaLM,使用的预训练数据集主要是纯英语文本。PaLM 2通过更加多语言和多样化的预训练混合来改进其语料库,其中包括数百种人类和编程语言、数学方程、科学论文和网页。
更新的模型体系结构和目标:
PaLM 2具有改进的体系结构,并在各种不同的任务上进行了训练,所有这些都有助于PaLM 2学习语言的不同方面。
评估PaLM 2
PaLM 2在WinoGrande和BigBench-Hard等推理基准任务上取得了最先进的结果。它比我们之前的大型语言模型PaLM更加多语言化,在XSum、WikiLingua和XLSum等基准测试中取得了更好的结果。PaLM 2还在PaLM和谷歌翻译的基础上提高了葡萄牙语和中文等语言的翻译能力。
以PaLM 2为底层逻辑的AI翻译方面确实有很大的提升,有每个拼音,还可以逻辑性的生成一些感觉词
预训练数据:
我们删除敏感的个人身份信息形式,过滤重复文档以减少记忆,并共享预训练数据中如何表示人员的分析。
总结
总的来说,由OpenAI掀起的人工智能狂潮,正在如火如荼的进行中,AI正处于高速发展的过程,每天甚至每分钟都在迭代和更新,希望这些科技最后都会在帮助人们带来更好的生活和便利。