整理 | 郑丽媛 屠敏
出品 | CSDN(ID:CSDNnews)
对于昨日 GPT-4 的意外发布,相信多数人都有如下想法:
1、多模态大模型 GPT-4 真的很强大!
2、恰好赶在了文心一言发布前夕,百度要如何应对压力?
蓄势了一个多月,承载着无数人或期盼或好奇的目光,“国产版 ChatGPT”「文心一言」今天终于正式亮相!
“「文心一言」并不完美,大家想要将其对标 ChatGPT,甚至是 GPT-4,但放眼全球大厂,百度是第一个做出来并真正发布出来的”,李彦宏说道。
“十月怀胎,一朝分娩”,那么接下来,就让我们开始这场万众期待的震撼发布,共同揭开「文心一言」的神秘面纱。
百度在大厂中第一个做出来的「文心一言」,实力几何?
在发布会伊始,对于外界频频问及的“为什么现在发布,百度是否真的做好了准备”等疑问,百度 CEO 李彦宏在开场进行了回应:
“过去多年,百度一直在进行 AI 技术的研究与研发。文心大模型首个版本在 2019 年便已发布,文心一言只是过去多年研发成果的延续。之所以现在发布,是因为现在市场有强烈的需求,包括百度从搜索、智能云到自动驾驶,再到客户、用户,都需要这样的技术。同时,大模型只有发布了,才会有用户反馈,只有通过不断地反馈,才能加速模型自身的迭代。”
紧接着,李彦宏就带着 5 个 Demo “炸场”,让大众一饱眼福。
(1)多模态生成
如果说昨日 GPT-4 带着多模态出现,用一张草图生成一个网站,让众多程序员感到惊艳,那么今天的「文心一言」在覆盖多种模态方面做得更为全面,可用文字生成图片、音频(方言)、视频等多个维度。
不过目前,由于生成视频的成本比较高,百度尚未对所有用户开放,未来会逐步接入。
(2)数理推算
「文心一言」还具备了一定的思维能力,能学会数学推演及逻辑推理等相对复杂任务。面对“鸡兔同笼”这类锻炼人类逻辑思维的经典题,「文心一言」能理解题意,并有正确的解题思路,进而像学生做题一样,按正确的步骤,一步步算出正确答案。
同样,现阶段「文心一言」在这方面准确率并不是 100%:“我们还需要给它更多的时间来学习和成长。”
(3)文学创作
在回答事实性问题时,生成式 AI 产品时常会出错,而「文心一言」延续了百度知识增强的大模型理念,大幅度提升了事实性问题的准确率。不论是总结《三体》的核心内容还是续写《三体》,「文心一言」都展现了其优越的总结分析能力和内容创作生成能力。
(4)中文理解
作为扎根于中国市场的大语言模型,「文心一言」具备中文领域最先进的自然语言处理能力,甚至可以理解“洛阳纸贵”并写出“藏头诗”。
「文心一言」能在中文领域领跑,相对应的,它对英文语种、代码场景的训练还不够多,这也是百度接下来加紧训练和完善的方向。
(5)商业文案创作
在商业文案创作上,「文心一言」也可以帮企业起名字、写 Slogan、写新闻稿等。
AI 要写好一篇稿子,除了要能准确理解用户意图,还要有清晰的表达能力——这背后有一个必要基础,那就是庞大的数据规模。「文心一言」的训练数据包括万亿级网页数据,数十亿搜索数据和图片数据,百亿级语音日均调用数据,以及 5500 亿事实的知识图谱。基于此,李彦宏指出:“这让百度在中文语言的处理上,能够处于独一无二的位置。”
背后的技术
百度 CTO 王海峰表示,「文心一言」是新一代知识增强大语言模型,是在 ERNIE 及 PLATO 系列模型的基础上研发的。
早在 2019 年 3 月,百度就发布了文心大模型 ERNIE 1.0,当时的文心 ERNIE 已经用上了知识增强的概念。同年 12 月,ERNIE 在自然语言处理领域权威数据集 GLUE 中登顶榜首,以 9 个任务平均得分首次突破 90 大关刷新该榜单历史。到了 2021 年,ERNIE 迭代至 3.0 版本,并刷新了 54 个中文 NLP 任务基准,其英文模型在国际权威的复杂语言理解任务评测 SuperGLUE 上,以超越人类水平 0.8% 的成绩登顶全球榜首。
百度研发的文心 PLATO 更是全球领先的开放域对话大模型,具备多轮流畅的聊天能力,并让对话具有人格属性,包括人设稳定性、知识增强、跨模态对话、情感抚慰、主动对话、长期记忆等。
王海峰指出,「文心一言」的关键技术包括有监督精调、人类反馈的强化学习、提示、知识增强、检索增强和对话增强。前三项是这类大语言模型都会采用的技术,ERNIE 和 PLATO 中也已经有应用和积累,在「文心一言」中又有了进一步强化和打磨;后三项则是百度已有技术优势的再创新,也是「文心一言」未来越来越强大的基础。
李彦宏预测大模型时代的三大产业机会
微软引入 OpenAI 的 ChatGPT API 接口之后,紧接着便推出了新版 Bing,Google 也发布了 Bard 大模型,欲开启属于人工智能时代的搜索引擎竞争。那么对于百度而言,「文心一言」的到来,会有什么样的不同?
在李彦宏看来,「文心一言」能够影响的不仅仅是搜索或者互联网公司,而是会影响到每一家公司。他表示,“生成式AI,将催生新产品、新业态,会有很多创业和投资机会。对于大部分创业者和企业来说,真正的机会并不是从头开始做 ChatGPT 和文心一言这样的基础大模型,这很不现实,也不经济。”
为此,李彦宏也针对大模型时代,做了三大产业机会预测:
第一类是新型云计算公司,其主流商业模式从 IaaS 变为 MaaS。「文心一言」,将根本性地改变云计算行业的游戏规则。之前企业选择云厂商更多看算力、存储等基础云服务。未来,更多会看框架好不好、模型好不好,以及模型、框架、芯片、应用这四层之间的协同。
「文心一言」将通过百度智能云对外提供服务,帮助企业构建自己的模型和应用,农业、工业、金融、教育、医疗、交通、能源等重点领域,都会因此效率大幅提升,并在每一个行业快速形成新的产业空间,助力数字中国的实现。百度智能云将于近期举办新闻发布会。主题围绕文心一言的云服务和应用产品,我们既有公有云服务和也可以做私有化部署,请大家期待。
第二类是进行行业模型精调的公司,这是通用大模型和企业之间的中间层,他们具有行业 Konwhow,调用通用大模型能力,为行业客户提供解决方案。我们的文心大模型,已经在电力、金融、媒体等领域,发布了 10 多个行业大模型。在各行各业都有机会。非常欢迎大家来跟我们合作。
第三类是基于大模型底座进行应用开发的公司,即应用服务提供商。今天,基于文本生成、图像生成、音频生成、视频生成、数字人、3D 等场景,已经涌现出很多创业明星公司,他们可能就是未来的新巨头。这里面的机会非常多,可以说每家企业在现在这个阶段都有机会。
李彦宏表示,“我们相信,人工智能会彻底改变我们今天的每一个行业。AI 的长期价值,对各行各业的颠覆性改变,才刚刚开始。未来,将会有更多的杀手级应用、现象级产品出现,将会有更多的里程碑事件发生。”
「文心一言」将陆续开放
当前,百度表示,3 月 16 日起,首批用户即可通过邀请测试码,在文心一言官网体验产品,后续将陆续开放给更多用户。此外,今日起,百度智能云面向企业客户开放「文心一言」 API 接口调用服务(https://cloud.baidu.com/survey_summit/wenxin.html?track=C896034 )的预约。
最后,对于「文心一言」的发布,我们也询问了一下 ChatGPT 的看法,不过在其答案中,有些数据存在一定偏差。
整体而言,正如李彦宏所说,目前的「文心一言」并不完美,这类大语言模型也还远未到发展完善的阶段。但未来这段时间,它一定会飞速发展,日新月异。
那么你对于「文心一言」的发布,又有什么想说的呢?
☞ChatGPT 的开源“替代”来了!前 OpenAI 团队出手,能用中文提问,3 天斩获 3k+ Star
☞烧数亿美元、耗上万颗英伟达 GPU,微软揭秘构建 ChatGPT 背后超级计算机往事 !
☞GPT-4 发布:在考试中击败 90% 的人类;谷歌开放大语言模型 PaLM API;FireFox 111 发布|极客头条