ChatGPT在全球掀起AI大模型的浪潮。
在美国,诸如OpenAI和Anthropic等初创企业,以及微软和谷歌等科技巨头,一同引领美国奋勇向前,在AI大模型的领域不断迈进。同时,在中国,美团的王慧文、阿里巴巴的贾扬清、前搜狗的CEO王小川,以及前京东的AI掌门人周伯文等众多已经取得辉煌成就的科技大咖再度崭露头角。
所谓他山之石可以攻玉,在这样的背景下,国家之间的发展现状如何呢?
美国:孤独求败
美国在AI大模型方面的强,是一直以来都很强。从2012年AI萌芽时期,到2016年AI1.0时期,再到2022年ChatGPT带来的AI2.0时期,美国一直是AI领域的破局者,引领着全世界AI发展再进一步。
比如目前几乎所有AI大模型的训练都采用了谷歌在2017年提出的Transformer网络结构。这种结构具备出色的长序列处理能力、更高的并行计算效率,无需手动设计的特点,同时还具备更强大的语义表达能力。因此,可以说在AI大模型领域,美国堪称是“别人家的孩子”。这也导致目前行业中最具代表性的AI大模型多数集中在美国。
比如OpenAI最新发布的多模态预训练大模型GPT-4,谷歌最新推出的“通才”大模型PaLM-E,拥有世界最大规模的5620亿参数,能看图说话、能操控机器人,以及刚刚解决AI绘画手指问题的Midjourney等等。
中国:组合拳活跃
许多人可能会认为,中国的AI大模型是从“文心一言”开始的。但“文心一言”其实只是一个类ChatGPT的产品,背后驱动它的AI大模型无论是百度、阿里、还是腾讯、华为都早有布局的由科技部和北京市知名高校支持的智源研究院的悟道1.0。
今年年初,基于文心大模型,百度发布文心一言,成为中国第一个类ChatGPT产品。阿里在2022年9月发布了“通义”大模型系列。同样在2022年,腾讯发布混元AI大模型,其中包含NLP、CV和多模态等基础模型和众多行业/领域模型。
在此之外,京东在2月10日宣布研发产业版ChatGPT—ChatJD,网易、360、字节跳动等也宣布了在AI大模型方面的布局。另外还有一些AI科技公司不断开发自己的垂直大模型,像实在智能近期发布的TARS大模型,也可圈可点,可以通过快速学习垂直行业的大量数据,可具备思维链、情景学习等能力,生成具有语法和意义的自然语言,可与人类进行对话并执行指令;支持私有化部署和定制化训练,确保数据和信息安全,为客户提供"有效、安全、可信任、可落地”的“大模型+”行业解决方案;与实在RPA结合,支持以“所说即所得”方式自动生成数字员工;与实在Chatbot结合,支持人机协同对话功能;与实在IDP结合,支持“所说即所懂”的智能文档处理能力。
所以我们大可不必纠结为什么ChatGPT没有发生在中国,因为未来仍然大有可为目前国内有头有脸的互联网企业基本都拥有一个AI大模型或制定了相应的计划。青出于蓝而“新”于蓝,AI大模型正在成为中国科技的一个新风向。