无需完美,文心一言已然自证百度

fb29cd0befe125a8520753178cc1a48c.jpeg

ChatGPT以火箭般的速度爆红,吹皱了中国科技圈和创投界的一池春水,引得无数人蠢蠢欲动。互联网大佬自掏腰包、带资建组,科技大厂摩拳擦掌、争先恐后,创业公司也不遑多让,甚至与AI不搭边的个别企业也借势营销,并因此而收获一波股价的大涨。

时隔一个多月再回看,在这场喧嚣与骚动当中,蹭流量和追风口者居多,真正躬身入局和实干者少之又少。目前来看,在全球大厂中,百度是第一个站出来的。

过去几年,在国际科技博弈的宏观背景之下,科技的自立自强成为全民共识,因此当ChatGPT横扫中国舆论场时,国人无比期盼自己人能开发出同类产品,并与之掰掰手腕。而过去10年在AI领域投入超过1100亿元研发费用的百度,自然成为被关注的对象。

在外界关注中,文心一言新闻发布会如约而至。3月16日新闻发布会上,百度基于大语言模型的生成式AI 产品“文心一言”开启邀请测试。首批用户即可通过邀请测试码,在文心一言官网体验产品。百度后续将陆续开放给更多用户,企业客户可以通过API接口调用服务,申请接入并体验文心一言的能力。

人有我也有,人有我更优

此前,各类人工智能产品普遍都是“人工智障”。而ChatGPT却出乎意料的聪明,能成为人们学习、工作、生活当中的实用工具,甚至取代部分学习、工作、劳动(当然,伦理问题另说)。AI从“人工智障”到“说人话”“干人事”的进阶背后,正是得益于大语言模型所具备的通用性和泛化性。

但是,搞大语言模型不是请客吃饭,拼的是真刀真枪的强投入和硬实力,海量多维度的大数据、顶尖的算法、强劲的算力、出色的产品和丰富且深入的场景缺一不可。正因为如此,大语言模型的研发门槛极高。

百度持续十年研发投入超过1100亿元,长期的投入让它在芯片层(高端芯片昆仑芯)、框架层(飞桨)、模型层(文心预训练大模型)和应用层(产品在诸多场景应用)实现了全栈布局,且拥有关键自研技术。

基于这样的积累,百度在2019年便推出了知识增强的语义理解框架ERNIE(文心大模型)。经过多次迭代,文心大模型已具备较强的泛化能力和性能。根据IDC在2023年2月发布的《2022中国大模型发展白皮书》,在国内9家主流厂商的大语言模型当中,百度文心大模型位于第一梯队,产品能力、生态能力、应用能力全面领先。

而此次百度基于大语言模型推出的生成式AI产品文心一言,具备包括文学创作、商业文案创作、数理推算、中文理解、多模态生成在内的多项通用能力,不仅做到了整体上的“人有我有”,还在某些局部做到了“人有我优”。

01-能写能创作

对于ChatGPT,大多数普通用户的直观感受,除了它什么问题都接得住并反馈相对得体的回答之外,便是拥有出色的写作能力,包括模仿知名诗人的风格创作诗歌,为一篇新闻稿件取标题,或者根据关键词写文章等等。

作为中国市场第一个公开发布的基于大语言模型的生成式AI产品,文心一言在写作这样的通用能力上,并不落于下风。

基于20多年搜索业务的积累,百度已建立起世界上最大的知识图谱,包含50亿实体、5500亿级事实,每天调用量超过400亿次。知识图谱以结构化的形式描述真实世界中的实体、属性、关系等,是机器认知世界的重要基础。

由于训练数据包括万亿级网页数据,数十亿搜索数据和图片数据,百亿级语音日均调用数据,以及上述知识图谱,因此文心一言大模型在中文语言的处理上处于独一无二的位置,尤其是在自然语言问答和创意内容生成上有突出表现。因而,不管是文学创作,还是商业文本写作,都难不倒文心一言。

在发布会现场,百度播放了文心一言的人机互动视频(百度创始人李彦宏解释,由于互动过程略微耗时,因此百度提前将互动过程提前录制成视频)。根据现场视频,在文学创作场景中,文心一言对科幻小说《三体》的核心内容进行了总结,提出了五个续写的建议角度,体现出对话问答、总结分析、内容创作生成的综合能力。同时,它准确回答了《三体》作者、电视剧角色扮演者等事实性问题。此外,面对“于和伟和张鲁一有哪些共同点”“于和伟和张鲁一谁更高”这类问题,文心一言也基于推理能力得出了正确答案。

而在商业文案创作场景中,文心一言顺利完成了给公司起名、写Slogan、写新闻稿的创作任务。

2b6499d8420bc3a8954cc9890c2707df.png

02-能逻辑推理

逻辑思维能力是一个人最重要的能力之一。而在人工智能流域,逻辑推理能力属于认知智能层面,相较于计算智能和感知智能,认知智能更为复杂,因此也成为人工智能研究的重点领域。

虽然OpenAI自己承认,新发布的GPT-4仍然会产生幻觉、生成错误答案,并出现推理错误,但它还是展现出出色的逻辑推理能力。比如当用户提问“格鲁吉亚和西亚的平均每日肉类消费量总和是多少?”,并要求GPT-4在回答前提供循序渐进的推理过程时,GPT-4便提供了解题的步骤,并且最终准确地给出答案。

而受益于百度知识图谱,文心大模型也成为了全球首个知识增强千亿大模型。研究表明,数据规模越大,尤其是当参数达到千亿级,大模型就可能发生“智能涌现”,涌现出知识和逻辑推理能力。这也使得文心一言拥有了数理逻辑推算能力,在学习一些标准的解题思路后,能把问题拆分成多个子问题,一步步推理来解答,从而给出正确的答案、避免一些错误。

现场视频中,面对“鸡兔同笼”这类锻炼人类逻辑思维的经典题,文心一言不仅能理解题意,而且还给出了正确的解题思路,进而像学生做题一样,按正确的步骤,一步步算出正确答案。

13628fe95883bb222c0b7217ec95d511.jpeg

03-能拟人化

在人类社会,人际交流是通过声音、文字、图像等感知交互方式的融合实现与完成,比父子对话,双方不仅仅是听对方的声音、识别其中的文字,还会看对方的表情,甚至肢体动作。

人工智能则是计算机通过对文本、图片、视频和音频等不同储存信息载体的认知和理解,结合环境因素来模拟人与人之间的交互方式。想让人工智能更理解人类世界,最优办法就是让AI成功理解多模态信息,并对此类信息形成分析、推理的逻辑和生成新信息的能力。

OpenAI在北京时间3月15日凌晨举办的发布会中有这样一个场景:OpenAI联合创始人兼总裁Greg Brockman在草稿本上用纸笔画出一张非常粗糙的草图,拍照并上传,GPT-4仅用时10秒左右,就直接生成了网站代码。在发布会的演示中,GPT-4不仅是能分析汇总图文图标,甚至还能读懂梗图,指出梗在哪里、解释为啥好笑。但令人遗憾的是,GPT-4标榜的图片输入生成文本并未向公众开放,生成图片及视频能力也仅仅停留在展示页面。

而文心大模型历经多次迭代,在更早之前也已经从单一的自然语言理解延伸到多模态,包括视觉、文档、文图、语音等多模态多功能,拥有出色的“拟人化”功能,并且在多项权威测评中都取得出色的成绩。比如跨模态文档智能大模型ERNIE-Layout,基于布局知识增强技术,融合文本、图像、布局等信息进行联合建模,在文档抽取、布局理解等5类11项任务刷新业界SOTA(在该项研究任务中,目前最好/最先进的模型);而作为业界首个融合场景图知识的多模态预训练模型,ERNIE-VIL在视觉常识推理、跨模态图像检索、跨模态文本检索等典型多模态任务中刷新了世界纪录。

676427846f8f6db35b0ea3a4492f2561.png

演示视频也展示了文心一言生成文本、图片、音频和视频的能力,其中在将文字转音频环节,它讲的是四川话。李彦宏表示,文心一言还能讲广东话、闽南话等。生成图片、音频能力,文心一言开箱即可使用。而视频生成成本较高,现阶段文心一言目前尚未对所有用户开放,不过未来会逐步接入。随着百度多模态大模型的迭代升级,文心一言的多模态生成能力无疑也将持续提升。

04-更懂中文

如果说到“人有我优”, 文心一言最显著的亮点和差异化优势,无疑还是它更懂中文。

中文是世界上最难学习的语言之一,不仅汉字、词汇的数量远多于其他语言,而且每个字、词的意思也极为繁多。正如那个关于“意思”的段子,同样的词汇,在每一句话中,背后所蕴藏的含义都不一样。

过去20多年,百度凭借着毫不逊色的技术实力和更懂中文的优势,长期占据着中文搜索引擎市场绝对霸主的王座。而作为扎根于中国市场的大语言模型推出的生成式AI产品,文心一言自然具备了中文领域最先进的自然语言处理能力。这种能力表现为对中文语言的理解,以及对中国文化的理解。

截至目前,文心一言已刷新93个中文NLP(自然语言处理)任务基准,并多次登顶SuperGLUE全球榜(由谷歌DeepMind、Facebook研究院、纽约大学、华盛顿大学等多个权威机构联合发布的复杂语言理解任务评测),已在机器阅读理解、文本分类、语义相似度计算等60多项任务中实际应用。

在现场展示中,文心一言正确解释了成语“洛阳纸贵”的含义、“洛阳纸贵”对应的经济学理论,还用“洛阳纸贵”四个字创作了一首藏头诗,全面展现了其对中文的理解、运用能力。

eb26e04ea8b518d80d5e48341d782b21.png

当然,由于“母语”和“语言环境”是中文,文心一言对英文的处理能力,不如中文好。李彦宏也承认了这一点,不过现场并没有进行演示。

李彦宏认为,从文心一言的表现看,某种程度上它具有了对人类意图的理解能力,回答的准确性、逻辑性、流畅性都逐渐接近人类水平。当然,他也承认,整体而言,这类大语言模型还远未到发展完善的阶段,有赖于通过真实的用户反馈而逐步迭代。

不过,从基础通用的写作、创作能力,到进阶的逻辑推理推算能力,从单一的自然语言处理到多模态多功能,在整体上,文心一言并没有明显短板。而这,已经不容易了。

为己,更利他

毫无疑问,不管是大语言模型、生成式AI,还是由此而开发出的ChatGPT、文心一言,在技术上都足够酷,但相比于技术本身,技术的应用和影响才是更多人关心的话题。

作为百度积累多年潜心打造的重大产品,文心一言首先将从整体上重塑百度的业务,为其带来全新的想象空间。

先说搜索。随着大语言模型的问世和优化,搜索引擎将从“模糊搜索”升级为“精准推送”,创造全新的使用体验,带来显著的效率提升。用微软CEO Satya Nadella的话说,“搜索引擎迎来了新的时代”。李彦宏也直言,“这将重塑信息的生成和呈现方式,有机会形成新的流量入口,帮助我们吸引更多的用户,并获得市场份额。”而伴随着搜索的升级,百度整个内容生态也将发生质变。

其次,文心一言也将与百度更多业务整合,从而激活整体业务的发展,重塑百度的想象空间。

fc96ce788c34b09fbe76376dcc3d3a60.jpeg

百度方面曾表示,作为基于百度智能云技术打造出来的大模型,文心一言将根本性地改变云市场的游戏规则——以前企业选择云厂商更多是看算力、存储等基础云服务,而以后企业对云的需求会更加聚焦智能服务,将更多关注框架、模型,以及模型-框架-芯片-应用这四层架构之间的协同。因此,借助文心一言的能力,云服务将从数字时代跃迁到智能时代,而智能化对各行各业效率的提升也将显著显现。

此外,百度还将文心一言搭载到Apollo智舱系列产品,提升智能汽车的人车交互体验,与小度进行集成、让小度更加聪明和善解人意。

过去,人工智能面临大规模落地应用的挑战,究其原因就在于开发门槛高、应用场景复杂多样、对场景标注数据依赖等问题突出。而如今,大语言模型凭借其优越的泛化性、通用性、迁移性,为人工智能大规模落地带来新的希望。IDC预测,未来,大模型将带动新的产业和服务应用范式,在深度学习平台的支撑下将成为产业智能化基座。

对于文心一言,百度不仅仅将其定位为自身的模型内部产品,而是将其视为人工智能基座型的赋能平台,希望通过新技术帮助千行百业实现智能化变革、效率提升,获得更强的竞争优势。用李彦宏在发布会现场的话说,“文心一言让每一家公司可以离客户更近。”

与行业头部企业联合研发融合行业数据、知识以及专家经验的行业大模型,是百度推进大模型深入产业落地的主要方式。目前,百度文心大模型已经在电力、金融、媒体等领域,发布了10多个行业大模型。作为AI底座,这些行业大模型在各行业帮助合作伙伴在产品创新、生产流程变革、降本增效等维度实现突破,产生价值。

例如,百度与TCL合作的CV大模型,面向多个产线多个环节的工业质检提供AI基座能力,在TCL几个产线检测mAP指标平均提升10%+,训练样本减少到原有训练样本30%~40%,产线指标即可达到原有产线效果,新产线冷启动效率可提升3倍,产线上线开发周期降低30%。

结语

在面向百度全员的财报信中,李彦宏写道,“生成式AI和大模型的智能涌现,是全新的计算范式带来的新机会。这意味着,AI技术已经发展到一个临界点,各行各业都不可避免地被改变。”

尽管在短短数月时间内,包括ChatGPT在内的大语言模型产品给世人带来了前所未有的震撼,AI还在持续快速迭代进化,不管对OpenAI、百度,还是对人工智能行业,亦或是整个数字经济来说,一切其实才刚刚开始。

推荐阅读:
世界的真实格局分析,地球人类社会底层运行原理
不是你需要中台,而是一名合格的架构师(附各大厂中台建设PPT)企业IT技术架构规划方案论数字化转型——转什么,如何转?华为干部与人才发展手册(附PPT)企业10大管理流程图,数字化转型从业者必备!【中台实践】华为大数据中台架构分享.pdf华为的数字化转型方法论华为如何实施数字化转型(附PPT)超详细280页Docker实战文档!开放下载华为大数据解决方案(PPT)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/21508.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Hugging face预训练模型下载和使用

Huggingface Huggingface是一家公司,在Google发布BERT模型不久之后,这家公司推出了BERT的pytorch实现,形成一个开源库pytorch-pretrained-bert。后来这家公司又实现了其他的预训练模型,如GPT、GPT2、ToBERTa、T5等。此时&#xff…

零门槛复现ChatGPT:预训练模型数据集直接用,在线可体验

明敏 发自 凹非寺量子位 | 公众号 QbitAI 这边ChatGPT、GPT-4等AI大模型和应用打得火热; 另一边“平替”开源复现方案也加紧更新迭代。 这不,“首个开源ChatGPT低成本复现流程”就来了波大更新! 现在,仅需不到百亿参数&#xff0c…

结合具体场景举例说明chatgpt预训练模型中Tokenization的原理

假设我们有一个场景,Alice想向Chatbot询问一部电影的推荐。她发送了一条消息:“你好,能给我推荐一部好看的电影吗?” 在这个场景中,Chatbot使用了ChatGPT预训练模型。首先,Chatbot需要对Alice的消息进行Tok…

举例说明chatgpt中生成式预训练模式中的预训练过程以及生成结果过程

生成式预训练模式(GPT)在自然语言处理任务中具有重要地位,它通过大量文本数据进行预训练,学习到一个通用的语言模型。然后通过微调,让模型适应特定任务。在这个过程中,GPT模型首先进行预训练,接…

魅魔php影视系统,魅魔全新且强大的视频电影程序(MacCMS PHP) 6.1 20120511

魅魔PHP影视系统,完全开源、强劲功能、卓越性能、安全健壮。超级易用、模板众多、插件齐全、资源丰富。构架稳健,实现平滑升级。 魅魔PHP影视系统 6.1 20120511 更新记录: 1,功能的累计性更新。 魅魔MacCMS视频电影程序是一套采用…

魅魔php影视系统,魅魔Maccms电影程序PHP

魅魔Maccms视频电影程序是一套采用ASPMSSQL/ACCESS (PHPMYSQL)环境下运行的完善而强大的视频电影系统。 经过近多年的开发经验和技术积累,魅魔Maccms视频电影程序已逐步走向成熟,在易用性和功能上已经成为同行中的佼佼者。 程序体积小->优化程序代码&…

寥寥几行代码,却改变了世界!

有那么一些代码片段,虽然只有寥寥几行,却能够给全世界带来巨大的影响。 链接:https://betterprogramming.pub/tiny-snippets-of-code-that-changed-the-world-fda104afc0d0 声明:本文为 CSDN 翻译,未经允许禁止转载。 …

chatgpt赋能python:Python绘制函数曲线:创造出令人惊叹的图形

Python绘制函数曲线:创造出令人惊叹的图形 随着越来越多的人开始关注数据可视化,Python成为了一种被广泛使用的工具,用于创建各种图形,包括函数曲线。Python图形库的灵活性和适用性使得它成为数据科学和工程领域中最受欢迎的编程…

chatgpt赋能python:Python手写体:Python程序员的最爱

Python手写体:Python程序员的最爱 介绍 Python手写体是指通过艺术化的方式将Python编程语言的代码转化成手写体风格的艺术作品。Python手写体的发展源于Python编程语言逐渐成为全球最受欢迎的编程语言之一。Python程序员喜欢用它来构建Web应用程序、数据分析、机器…

最新免费版 Office 全家桶Copilot,Gamma+MindShow 两大ChatGPT AI创意工具GPT-4神器助力高效智能制作 PPT,一键生成,与AI智能对话修改PPT(免安装)

目录 前言ChatGPT MindShow1. 使用ChatGPT工具生成PPT内容2. 使用MindShow工具一键智能制作PPTMindShow简介使用网页版制作pdf转ppt GAMMA AI神器GAMMA.app介绍注册 decks操作Guided 指导Text to deck 文本到PPTpdf转ppt协同操作其它 参考资料其它资料下载 前言 2023年3月&am…

【Twitter 舆论分析】Twitter 实时推文爬虫

0x00 前言 继续探索Twitter API的使用,这次获取一下Twitter的实时推文。 0x01 具体步骤 1、sample-steam 样本流 这是Twitter提供的代码,比较简单,只需要更改一下"bearer_token"即可使用,相对获得的数据单一&#x…

Android 实现用户收藏新闻以及查看新闻(简易新闻 六)

Android 实现用户收藏新闻以及查看新闻(简易新闻 六) 效果图: 因为录制的gif过长无法上传,所以这里分为两段,一段是用户未登录状态下收藏新闻需登录,用户登录后可以收藏: 第二段用户未登录查看…

关于世界杯的一篇文章-ChatGPT

世界杯是国际足球的最高荣誉,每四年举办一届,是世界上最受欢迎的体育赛事之一。自1930年首届世界杯在乌拉圭举办以来,已经举办了20届。 由国际足联(FIFA)主办,每届比赛都会在举办国举行,由32支…

2021最近的新闻大事10条简短 今天的新闻大事10条汇总

每天精选2021最近的新闻大事10-12条,365资讯简报 汇总近期、今天的新闻大事。每一条热点新闻大事件都比较简短,可以用作新闻大事件摘抄素材! 【365资讯简报】每天一分钟,知晓天下事!2021年1月12日 星期二 农历十一月廿…

收藏|最全的LIMS实验室信息管理系统介绍

实验室信息管理系统(LIMS),就是指通过计算机网络技术对实验的各种信息进行管理的计算机软、硬件系统。也就是将计算机网络技术与现代的管理思想有机结合,利用数据处理技术、海量数据存储技术、宽带传输网络技术、自动化仪器分析技术,来对实验…

使用大型语言模(LLM)构建系统(四):链式提示

今天我学习了DeepLearning.AI的 Building Systems with LLM 的在线课程,我想和大家一起分享一下该门课程的一些主要内容。 下面是我们访问大型语言模(LLM)的主要代码: import openai#您的openai的api key openai.api_key YOUR-OPENAI-API-KEY def get_…

AIGC - 生产力新工具 Bito AI

文章目录 Bito AI 是什么Bito AI 能干啥官网免费的吗?如何使用 Bito方式一:方式二:在这里插入图片描述方式三 Bito AI 是什么 Bito AI是继Github Copilot、Cursor、CodeWhisperer等AI智能编程产品之后发了一大AI编程工具 。 Bito是一款建立…

ChatGPT背后的技术

ChatGPT背后的技术InstructGPT,论文标题为 Training language models to follow instructions with human feedback。 语言模型(Language model)的原理是给一段文本,让它去预测后面下面的词是什么。在预训练中它的训练数据是没有标签的,是自…

揭密ChatGPT背后团队鲜为人知的小秘密

ChatGPT引领的人工智能技术浪潮还在持续火爆,可是做出这款产品的OpenAI公司,熬得住多年的冷板凳,最终一飞冲天,他们是怎么做到的呢? 因此,我对这家企业的组织建设产生了浓厚的兴趣。我找啊找,最…

一点就分享系列(实践篇6——上篇)【迟到补发_详解yolov8】Yolo-high_level系列融入YOLOv8 旨在研究和兼容使用【3月份开始持续补更】

一点就分享系列(实践篇5-补更篇)[迟到补发]—Yolo系列算法开源项目融入V8旨在研究和兼容使用[持续更新] 题外话 [最近一直在研究开放多模态泛化模型的应用事情,所以这部分内容会更新慢一些,文章和GITGUB更新并不同步,g…