文心大模型3.5勇夺三个冠军领跑,中文完爆GPT-4!国际权威报告7项满分「全班第一」...

outside_default.png


  新智元报道  

编辑:编辑部

【新智元导读】这场百模大战,究竟是谁胜出?国际权威IDC发布大模型技术报告中,文心大模型3.5拿下7个满分,三个绝对第一。

一觉醒来,好不热闹,Meta深夜投出重磅炸弹,Llama 2既开源还能商用,简直让大模型领域变了天了。

在Azure上可部署,在Huggingface上可下载,Meta再次回到AI主战场,牛到不可思议。

短短一周内,硅谷是真卷起来了。Bing推出Bing Chat企业版,Anthropic发布GPT-4最强竞品Claude 2,谷歌Bard也发布大量更新……

就在刚刚,小编也体验到了百度文心一言最新的文生视频、ChatFile插件等新功能。

现在,文案、视频,全都能交给它来解决——

根据自己生成的内容,文心一言可以分分钟输出一个视频,连视频配文都帮你贴心地写好。UP主们简直要笑疯!

据介绍,文字转视频的能力、直接生成视频的能力,目前是在百度内部测试。

IDC「AI大模型评估报告」,文心大模型全班第一


与此同时,国际权威IDC发布了业内首个大模型评估报告——《AI大模型技术能力评估报告,2023》。

报告中,IDC从多维度测评大模型的能力,将大模型分为三大层服务生态、产品技术以及行业应用。

每个指标有1分-5分五个层级,得分越高代表厂商大模型技术能力越强。

outside_default.png

值得一提的是,百度文心大模型3.5拿下12项指标的7个满分,综合评分第一,算法模型第一,行业覆盖第一。

这三个绝对第一,体现了百度文心大模型的基础技术深度和产业应用覆盖广度。

根据IDC的报告,百度AI大模型整体竞争力位于领先水平,在模型能力、工具平台、生态布局以及行业覆盖上优势明显,并已提前进入商业化落地探索阶段。

outside_default.png

从3月16日文心一言发布到5月,文心一言的「内核」文心大模型就升级到了3.5版本。

它实现了基础模型升级、精调技术创新、知识点增强、逻辑推理增强,插件机制等,模型效果提升了50%,训练速度提升了2倍,推理速度提升了30倍。

既然文心大模型3.5是文心一言的内核,那就让我们看看23年6月30日上线的V2.2.0版文心一言,究竟强在了哪?

文心大模型3.5,功能全面升级


这次,文心一言升级后最大的变化,就是全新的「插件」功能了。

outside_default.png

可以说,插件就像给大模型们上了一层buff,被禁锢的能力,瞬间就被释放出来。

比如GPT-4搭载的Code Interpreter就强到令人发指,甚至很多人说应该叫它GPT-4.5才对。

文心一言,当然也少不了强大插件的加持。

检索(热点实时追踪)

在搜索技术上,百度积累了大量优势。

「百度搜索」插件背后,是更强的搜索技术和更强的搜索底层架构。

而集成插件之后的文心大模型3.5,现在可以对互联网各个角落的信息了如指掌。

outside_default.png

比如今天的爆炸性新闻,Meta发布了开源且免费商用的Llama2,还和微软云服务Azure、高通芯片都展开了合作。所以这对全世界大模型的格局会带来哪些改变?

文心一言指出,Meta在AI领域重新拿回了影响力,大模型的商业模式也被彻底改变。

outside_default.png

Meta此举对于OpenAI和谷歌的商业版图,会有何影响呢?

文心一言总结得全面又透彻——增加竞争压力、激发创新活力、扩大市场份额、加速行业变革。

outside_default.png

搜索和大模型的能力一结合,开了挂的文心一言,简直分分钟化身商业分析师。

文档(PDF/Word都可以)

除了联网,百度这次还给文心一言新加入了一款ChatFile插件。

在上传文档之后,用户只要用自然语言,就能对其中的内容进行问答检索和总结摘要。

而且,通过这种超长文档的回答,ChatFile可以大幅拓展模型处理文字的长度了。

在使用过程中,ChatFile会对文档的每一个段落都进行语义索引和向量化建库。

outside_default.png

最近,猎聘大数据研究院重磅发布了一份《AIGC就业趋势大数据报告2023》,都有哪些核心内容?上传文档,文心一言几秒就能帮你做出又快又好的总结。

outside_default.png

你还可以就文档细节,让它给你做个归纳总结。

outside_default.png

或者让文心一言帮你总结一篇arXiv论文。

outside_default.png

有了文心一言的ChatFile插件,以后看论文,是省时又省力了。

outside_default.png

更懂中国人的大模型


文心一言,显然是更适合中国宝宝体质的大模型。

无论是文言文,还是知乎、小红书这类社交媒体文案的创作,当然还是我们自己的中文大模型最擅长。

outside_default.png

进化后的文心大模型3.5,直逼GPT-4

正在热映的「长安三万里」,为我们重现了一把大唐的极致浪漫。

年少意气风发的李白,命运几番浮沉。

outside_default.png

他曾写下的「轻舟已过万重山」,也再次成为大家关注的焦点。

谪仙人李白写下这句诗时,究竟是怎样的心境?

outside_default.png

在诗词歌赋这类中国传统文化方面的表现,文心一言可谓是相当出色。

不仅对答如流,而且还能分析出诗句的含义和妙处。

甚至,还给难(kao)读(dian)的词语,标上了拼音。

outside_default.png

而GPT-4这边,堪称一个「缝合怪」。

一方面,通篇都没有原作曹操什么事,还把李白写的《赠汪伦》安在了陆游身上。

另一方面,诗句的补全更是离奇。前四句还好好的,然而从第五句往后,GPT-4就开始放飞自我了……

outside_default.png

再比如,北宋文学家欧阳修的《生查子•元夕》中,「月上柳梢头,人约黄昏后」描写的是哪个传统节日?

文心一言答:元宵节。

outside_default.png

GPT-4不仅误判成了中秋节,而且还替苏轼「写」了一首「临江仙·满江红」……

outside_default.png

此外,对于成语的理解,文心一言也相当拿手。

outside_default.png

正确与否,我们贴上来自「百度百科」的回答,就一目了然了。

outside_default.png

相比之下,GPT-4再一次陷入到了自己的幻觉当中。

outside_default.png

中文创作,全面发展

写起古诗来,文心大模型3.5也是完胜GPT-4。

比如以「思念无期」写一首藏头诗。

文心一言不仅完美藏了头,离别之苦、思君之愁的感觉也一并表达了出来。

outside_default.png

GPT-4写的藏头诗,相比之下可是逊色了不少。

outside_default.png

一句话:写诗,还得看咱们自己的大模型!

另外,文心一言不仅是一位「文学大师」,还是一位「文案高手」,可以根据不同平台的风格调性,创作贴合的文案。

用知乎体回答一下:「人生中拿到一副烂牌被自己打好了是种怎样的体验?」

outside_default.png

「谢邀」俩字一出,张口就知是老知乎er了。

outside_default.png

最近,「特种兵旅游」、「夕阳红老年团游」都out了,现在流行的是Citywalk。那就请文心一言写一份北京的citywalk线路吧。

outside_default.png

经常上网冲浪的盆友们,你们是不是经常遇到这种文案,文采飞扬、意境绝佳,但就是不知所云。

outside_default.png

有了文心一言,对方来一句,咱们来十句。讲不讲得通另说,要的就是一个气势。

outside_default.png

outside_default.png

就在刚刚,2023年的暑期档电影票房已经超过了90亿元。

虽然不能亲自到影院,但会上网的文心一言,写起影评来是真不在话下。

outside_default.png

有人说,大龄程序员的归宿就是送外卖和开奶茶店。

outside_default.png

干到三十多卷不动了,带着50万存款回老家开一家奶茶店可行吗?文心一言帮你分析。

outside_default.png

玩梗,它是独树一帜

对于那些独属于中文互联网的热梗,文心一言就更加如鱼得水了。

outside_default.png

在「百度搜索」插件的加持下,文心一言把最近流行的「白人饭」给解释得明明白白。

outside_default.png

面对同样的问题,GPT-4也必须开启一些「科技与狠活」,才能get到。

至于回答的质量,两个大模型可以说是不相上下。

outside_default.png

相比之下,无法联网的GPT-3.5,就一脸懵圈了。

outside_default.png

outside_default.png

「哈基米」也算是一个洗脑了无数人的bgm。所以,这究竟是什么梗?

outside_default.png

文心一言立马说出了「哈基米」的出处,其实在日语中,原音为はちみ。没想到,被网友用来给猫猫视频配音后,火遍全网。

outside_default.png

除了热梗,文心一言还很懂流行的emoji,比如常见的🐂🍺。

outside_default.png

对于很多人都不太懂的「阴阳脸」,文心一言不仅解读emoji,还给出了场景解释和使用警告。

outside_default.png

打工人最爱的效率小助手


邮件、脚本、策划、思想汇报、旅游攻略……文心一言,让你的摸鱼打工生活更轻松!

多么个性化的需求,它都能给出逻辑清晰、内容充实的答案。

outside_default.png

制图能力

如今的文心一言,在「绘制表格图示」的能力上,得到了巨大的提升。

之前的3.0,做出的工作计划表还略显粗糙。

outside_default.png

到了3.5,制表能力显然已经全面升级,内容安排十分合理。

outside_default.png

此外,更新到3.5版本的文心大模型,还能根据表格内容画出对应的柱状图。

outside_default.png

数学代码大提升


在这次升级中,同时增强的,还有数学、推理,以及代码能力。

比如,文心一言曾经一直做不出来的加速度问题,进化后的3.5版本就可以轻松搞定。

outside_default.png

此前文心一言版本

outside_default.png

目前文心一言版本

现在,让它手写一段「统计字符串中出现次数最多的字符及次数」的代码,升级后的文心一言,一次就给出了能用的代码,并且附上了每段的释义。

甚至,还完美解决了出现次数最多的字符不止一个时的情况。

outside_default.png

输出结果如下:

outside_default.png

outside_default.png

一些有趣的应用


除了知识渊博,文心大模型3.5还是个有趣的灵魂。

角色扮演

最近,很多网友被确诊为沈眉庄,因为到处都是游客只想窝在家里。还有一些人被确诊为安陵容,因为每天都觉得好累。

outside_default.png

而文心一言的角色扮演功能,当然也不容错过。

outside_default.png

没事和大模型辩论几句,也算是非常锻炼口才和逻辑能力。

outside_default.png

outside_default.png

和文心一言你一句,我一句的暗号,家人们谁懂?

outside_default.png

多模态生成

现在,数一数全世界的大模型,有多模态能力的大模型真没有几家。

而作为「全村骄傲」的文心一言,在跨模态内容的生成上,也在稳步提升。

文生图、文生音频、文生视频、图生文字……跨模态内容生成,就是文心一言的「独门秘术」。(部分功能未完全开放体验)

比如,生成一个「赛马娘」风格的二次元女孩。

outside_default.png

确实,有那味了。

outside_default.png

之前,文心一言画的「林黛玉倒拔垂杨柳」虽然很酷炫,但和「林黛玉」不能说是一模一样,可以说是毫不相干。

outside_default.png

而3.5画的版本,就很有83版《红楼梦》里那个时代特有的圆润古典美女feel了。

outside_default.png

画汉服美女,生成的图片也比之前自然了许多。

outside_default.png

另外,文生音频也是文心一言的独门秘术。

outside_default.png

百度文心凭什么「卷」?


从文心一言的发布到现在,文心大模型实现了从3.0到3.5的华丽转身。

我们也看到了,文心大模型3.5模型的性能已经取得了重大飞跃,在问答、创作、推理等任务上表现出色。

与此同时,IDC报告中对文心大模型能力评估结果的客观性也得到了印证。而且其算法模型是9个评估者中唯一一个取得满分的模型。

文心大模型3.5在基础模型训练上,采用了飞桨最先进的自适应混合并行训练技术+混合精度计算策略。

还采用多种策略优化数据源及数据分布,大大加快了模型的迭代速度,显著提升了模型效果和安全性。

outside_default.png

此外,百度文心大模型研发团队创新了多类型多阶段有监督精调、多层次多粒度奖励模型、多损失函数混合优化策略、双飞轮结合的模型优化等技术,使模型效果及场景适配能力进一步显著提升。

outside_default.png

那么,为什么文心大模型能够成为国内的领先者?

首先,百度能够成为全球科技大厂中第一个发布类ChatGPT大模型公司,是因为在模型研发上有长期的投入和积累。

其实早在2019年3月,百度就发布了预训练模型文心1.0(ERNIE 1.0),并且不断迭代到2.0、3.0、3.5版本。

outside_default.png

而文心是百度自主研发的产业级知识增强大模型,借助海量的知识积淀和丰富的应用场景,让其具备了知识增强、产业级两大特色。

其中包括了NLP、CV、跨模态等基础模型,对话、跨语言、搜索、信息抽取等任务大模型,生物计算领域大模型,行业大模型,以及支撑大模型应用的工具平台,形成了「基础-任务-行业」三级大模型技术体系。

outside_default.png

其次,百度是全球为数不多在IT四层架构(芯片层、框架层、模型层、应用层)都有全栈布局的AI公司。

百度在这四层,都有全栈自研的技术产品。并且,层层领先,可以实现端到端优化,大幅提升效率。

除了刚刚提到的模型层,百度在芯片层有昆仑芯。目前,已经成功部署几万片,第三代预计2024年初就能量产。

在深度学习框架层,百度飞桨是中国首个自研的开源开放的深度学习平台,在中国的市场综合份额排第一。

在应用层,百度全部产品都在进行着AI原生的重构。

得益于四层架构端到端的优化,尤其是框架层和模型层的协同优化,才使得文心大模型效果、训练、推理速度飞速提升。

除了作诗,还要做事


文心1.0发布后,百度率先推出了行业大模型,构建大模型工具与平台。

文心大模型对外提供一系列大模型开发套件、大模型API,以及集成文心大模型的飞桨企业版EasyDL和BML开发平台。

这样能够面向不同开发者,以全面释放大模型使用效能,降低应用门槛。

基于多年来的技术生态,以及四层架构的打下的基础,才让文心大模型能够从众多模型中脱颖而出。

百度创始人、董事长兼CEO李彦宏曾表示,所有的应用都将基于大模型来开发,每一个行业都应该有属于自己的大模型。

文心大模型也不例外,目前已经在搜索、信息流、智能音箱等互联网产品实现大规模应用。

IDC评估结果显示,百度文心大模型在行业覆盖上获得唯一满分成绩,在能源、金融、教育、医疗等领域已经实现广泛业务布局和落地场景探索。

以能源电力为例,百度文心联合国家电网有限公司,面向复杂电网的专业场景,基于文心大模型训练了电力行业大模型。

百度也和深圳燃气联合发布了燃气行业大模型,破解燃气企业运营场景繁杂、安全风险识别困难等难题。

另外,还有面向金融行业、汽车行业、制造行业等领域的大模型。

未来,百度文心大模型将不断利用其算法模型的基础技术优势,帮助各行各业将大模型转化为自身的生产力工具,实现智能化的转型与升级。

确定无疑的是,文心大模型仍将不断迭代,为千行百业赋能,进而改变世界。

outside_default.png

outside_default.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/28738.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

文心一言APP来了

金磊 丰色 发自 凹非寺量子位 | 公众号 QbitAI 终于,正版百度文心一言APP上架苹果商店了! (此前百度因为盗版文心一言APP泛滥,还起诉过苹果公司及相关开发团队。) 这般“新鲜出炉”的工具,我们当然要率先体…

文心一言APP国区可下载!免费体验120+玩法,PPT大纲Excel公式一键生成

点击关注公众号:互联网架构师,后台回复 2T获取2TB学习资源! 上一篇:Alibaba开源内网高并发编程手册.pdf 终于,正版百度文心一言APP上架苹果商店了! (此前百度因为盗版文心一言APP泛滥&#xff0…

文心一言APP国区可下载,免费体验120+玩法,PPT大纲Excel公式一键生成

来源:量子位 | 公众号 QbitAI 终于,正版百度文心一言APP上架苹果商店了! (此前百度因为盗版文心一言APP泛滥,还起诉过苹果公司及相关开发团队。) 这般“新鲜出炉”的工具,我们当然要率先体验一把…

chatgpt赋能python:Python给电影打分-如何使用Python评估您最喜爱的电影

Python给电影打分 - 如何使用Python评估您最喜爱的电影 Python是一种流行的编程语言,广泛用于数据科学和机器学习。但是,您是否知道您可以使用Python为您最喜爱的电影打分并评估其受欢迎程度?在这篇文章中,我们将介绍如何使用Pyt…

文心千帆大模型平台,一站式企业级大模型平台

文心千帆大模型平台,一站式企业级大模型平台 0. 前言1. 人工智能发展历程1.1 传统机器学习1.2 深度学习1.3 大模型时代 2. 文心千帆2.1 文心千帆介绍2.2 文心千帆应用场景2.3 文心千帆平台优势 3. 文心千帆初体验3.1 注册流程3.2 创建应用3.3 在线测试3.4 数据服务3…

【自我升级链】所谓的傅盛认知升级

所有学习上的成功,都只依靠两件事 – 策略和坚持,而坚持本身就是最重要的策略! 前段时间读的书,看的一些文章里面,全都在提"认知"这个词。 但是,“认知”这个词,我是在2016年的时候就…

傅盛:AI是企业弯道超车的机会,大家在同一起跑线上

2019-10-20 11:58:08 第六届世界互联网大会于10月20日-22日在浙江乌镇召开。 猎豹移动CEO傅盛表示,从收入的相对值增长来看,猎豹的AI业务的增长还是挺快,“但是要短期内达到猎豹50亿级的盘子是不太可能的”。 傅盛认为,AI是企业弯…

从猎豹CEO傅盛和韩寒的没落,谈谈为什么曾经优秀的人突然变得平庸?

点赞再看,养成习惯,微信搜一搜【findyi】关注这个喜欢写情怀的程序员。 回复【1】获得程序员职场晋升PPT一份 一个读者的提问:洋哥,我从小都是学霸,本硕都是985,计算机科班出身,但进入职场后却始…

金山网络CEO傅盛: 产品设计, 简单才是王道

本文来自 http://www.36kr.com/p/151814.html 2012 年 9 月 8 日—9 日,中国软件开发者大会在北京国家会议中心举行,金山网络 CEO 傅盛在会上发表题为“简单唯美”的演讲,他表示,项目要想成功,产品设计一定要足够简单&…

傅盛认知三部曲之一:所谓成长就是认知升级

我一直在思索,怎么才能让一家公司更快地成长?一个人怎么才能从一群人的竞争当中脱颖而出? 1、人的四种认知状态 最近我看了一幅图,我在其上加了一个数字注脚。 这是一个人认知的四种状态——“不知道自己不知道”,“知…

【深度好文】强烈推荐:傅盛认知三部曲!

转载傅盛认知三部曲的原因 最近看到 傅盛 大佬关于认知的几篇文章,感觉实在牛逼,在此转载一下。 大家优先点击下面的几个链接查看原文吧!!!!!! 傅盛认知三部曲之一:所谓…

张鹏对话傅盛:产业互联网时代需要什么样的机器人?

12月21日,备受瞩目的极客公园创新大会十周年活动继续在北京举行。作为中国大型的创新者社区,全球科技、科学、文化艺术、创造力等领域里的科技主义者们在此汇聚一堂,共同为中国极客奉献思维升级的盛宴。猎豹移动董事长兼CEO傅盛受邀出席大会并…

傅盛:我为什么要不顾一切的努力?

猎豹最近不太好,刚被谷歌下架了45款产品。作为CEO,傅盛一定很难受,更要命的是,这次舆论站在了他的对立面,不少落井下石的人和媒体,一时间全部出动。 傅盛在360工作过,我加入360的时候恰逢傅盛和…

机器人军团和傅盛的答案

雷锋网消息,1月25日,傅盛再度卷入“人设崩塌”事件,起因为傅盛在自己公众号上发表了一篇名为《傅盛持续创新的十大“金句”》的文章,该文章由傅盛和极客公园创始人张鹏在2019 极客公园创新大会上谈话整理。此后引发与潘乱&#xf…

机器人军团和傅盛的答案

雷锋网消息,1月25日,傅盛再度卷入“人设崩塌”事件,起因为傅盛在自己公众号上发表了一篇名为《傅盛持续创新的十大“金句”》的文章,该文章由傅盛和极客公园创始人张鹏在2019 极客公园创新大会上谈话整理。此后引发与潘乱&#xf…

大模型创业:朱啸虎与傅盛的观点碰撞

在科技领域,大模型创业已经成为了一个热门的话题。随着AI技术的发展,大模型的应用越来越广泛,但同时也带来了一系列的挑战。最近,知名投资人朱啸虎和创业者傅盛就大模型创业的价值进行了一场激烈的讨论。本文将从他们的观点出发&a…

傅盛:认知升级三部曲

一、所谓成长就是认知升级 我一直在思索,怎么才能让一家公司更快地成长?一个人怎么才能从一群人的竞争当中脱颖而出? 1.人的四种认知状态 最近我看了一幅图,我在其上加了一个数字注脚。 这是一个人认知的四种状态——“不知道自…

【小米MIoT设备接入HomeAssistant通用插件教程】

【小米MIoT设备接入HomeAssistant通用插件教程】 1. Xiaomi Miot Auto介绍2. 常见问题3. 安装/更新3.1 方法1: [HACS](https://github.com/hacs-china/integration)3.2 方法2: 通过Samba或SFTP手动安装3.3 方法3: 通过SSH或Terminal & SSH加载项执行一键安装命令3.4 方法4:…

《鱿鱼游戏》我怕了,还是整点阳间的游戏吧,Python版“碰糖”来袭—你能过几关?

导语 哈喽!哈喽!我是木木子,之前想着给大家写点儿好玩儿的~ 嘿嘿嘿——现在开始上线更新文章啦!喜欢的小伙伴儿多多支持呀! ​ ​​大火的韩国电视剧《鱿鱼游戏》,从123木头人到画糖,感觉十…

ChatGPT Prompt Engineering for Developers from DeepLearning.AI

链接:https://learn.deeplearning.ai/chatgpt-prompt-eng/lesson/1/introduction In this course, there are some example codes that you can already run in Jupyter Notebook. Below, I will write down the core knowledge points, such as how to build a pr…