大厂赶超ChatGPT

 

ChatGPT上线的两百天里,国内大模型发展开启“狂飙”模式。

据称,中国10亿参数规模以上的大模型已发布79个。

大模型进化场,讲究一个百模混战:百度文心大模型已进化至3.5形态;阿里通义千问构建家族模式;京东言犀大模型则是为自己“量身定做”的产业大模型;美团牵手清华系,领投AI公司智谱华章;360智脑将接入“360全家桶”……

大厂大模型进化论,残酷又现实,要么赶超,要么被淘汰。

抢跑且不停刻苦训练的百度文心大模型3.5,近日宣称最新版本文心一言能力已经超出ChatGPT 3.5。

物竞天择,适者生存,大厂大模型纷纷赶超ChatGPT。

一、大厂大模型超过ChatGPT3.5

身穿黑色内搭外穿白色西服外套,搭配干净利落的短发,出现在AI大模型技术能力评估报告大会上。

前一天晚上还在修改议题,刚刚出差回来的百度集团副总裁吴甜在会上说到:“新版本文心一言能力已经超出ChatGPT 3.5,这也是在我们国内开展相关技术工作是重要的里程碑。”

这是继科大讯飞刘庆峰提到星火大模型即将赶超ChatGPT后,又一家大厂正式确认大模型超过ChatGPT。

今年3月,百度新一代知识增强大语言模型“文心一言”公开邀测,该模型基于文心大模型3.0版本打造。时隔3个多月,已经升级为3.5版本的文心大模型,在效果、功能、性能全面提升。

文心一言3.5赶超ChatGPT3.5,很大可能是在功能方面新增了插件机制,文心大模型3.5通过插件方式扩增了大模型的能力边界。

大模型强调大模型技术实力和底座能力。今年5月份,百度上线的新底座大模型正是文心大模型3.5,该模型是文心一言系统的基础模型,给了文心大模型扎实的底座基础,也让文心一言3.5成功赶超ChatGPT。

值得一提的是,在基础模型训练中,3.5版本还采用了飞桨最先进的自适应混合并行训练技术及混合精度计算策略,这大大加快了模型的迭代速度。

众所周知,百度一直在深耕全栈式人工智能技术研发,共四层:芯片层、框架层、模型层和应用层。

芯片层有昆仑芯;框架层有深度学习平台飞桨,有力支撑了大模型的高效训练和推理;模型层有文心大模型;在应用层,目前有15万家企业申请接入文心一言测试。

其中,飞桨平台已经有750万开发者,对比中国软件从业人员800万—1000万,尽管软件从业人员和深度学习开发人员不完全一致,但在人才数量上的优势也为文心3.5赶超ChatGPT提供了大容量智库,类似超脑的存在。

中国企业在获得中文语料和对中国文化的理解方面,相较于外国企业本来就有着天然的优势,中国制造业门类最全,具有面向实体产业训练产业AIGC的有利条件。

众多因素合力助推,文心大模型3.0为基座的文心一言发布一百多天后,在飞桨与文心的协同优化下,文心大模型3.5成长飞速,最新模型效果提升50%,训练速度提升2倍,推理速度提升30倍,成功赶超ChatGPT。

在基础技术之上,百度额外开展了三大增强技术:知识增强、检索增强和对话增强。

将大模型类比成人类,人如果用知识结构,知识体系的方式进行学习的话,学习效率更高。再学会使用工具进行搜索,实现端对端的极简化检索,又可以提升时效性。

大模型自己学习完之后,还得学会反馈式强化训练,对话增强很像是不断让大模型在做题,在对话中告诉大模型哪里对,哪里不对,通过提示的方式,让大模型能够增强记忆机制,有效的让他按照我们希望的方式来回答问题,教会这个孩子怎么样回答的更好。

除了技术实力,大模型需要落地。

在行业应用方面,百度文心大模型源于产业实践,服务于产业实践,已经摸索出大模型产业落地的关键路径,还发布了涵盖众多行业和领域的大模型,加速对行业智能化转型。

目前,国家电网、浦发、泰康、吉利、哈尔滨市、深圳燃气、TCL等企业单位,百度文心大模型均有合作。

此外,百度十年来研发投入超1000亿,2021年核心研发投入占比超23%,人工智能专业申请量和授权量连续5年排名国内第一,深度学习专利申请量全球第一。百度能在AI大模型领域有突破,与百度在要素资源上的大力投入也息息相关。

可以看出,大厂大模式,拼研发的时刻到了。

二、大厂大模型哪家强?

今年上半年正式公开宣布做大模型的企业就有近百家,各家大模型正陷入酣战。其中,有阿里、百度、腾讯、京东、字节跳动等互联网大厂玩家,也有科大讯飞、商汤科技等AI公司,还有其他“杂牌军”也混入其中。

半年时间,大模型赛道完成了从概念到落地的进程,这放在任何赛道都很炸裂。

但是,到目前为止,都没有明确的指标或者准则去验证谁家的大模型更优质,一个接着一个发布会,“王婆卖瓜自卖自夸”式的自我评价,令人眼花缭乱之余,并没有太多客观性。

那么,百模大战,究竟谁更胜一筹?

在IDC最新发布的《AI大模型技术能力评估报告,2023》中,首次提出AI大模型技术能力评估框架。

评估大模型共有三大维度:产品技术、服务生态、行业应用。

具体细分指标可达12个:算法模型、服务能力、通用能力、创新能力、平台能力、安全可解释、生态合作、行业覆盖、金融、工业、医疗、能源。

其中,算法模型和行业覆盖,是衡量大模型能力最重要的2个指标,特别是,二者可以形成持续迭代提升的飞轮。

产品技术能力中,“算法模型”维度是大模型能力最为核心的要素,也是决定大模型应用效果的根本所在。

原因在于,只有通过算法模型技术的突破,实现具有通用效果优势的大模型底座,才能支撑更广泛的行业覆盖,使各行各业充分享受技术突破带来的红利,破解AI落地门槛高的困境。

行业应用能力中,应用覆盖的广度是当下大模型厂商最为关注的指标,是大模型效果通用领先性、行业结合能力的综合体现。

所以,“行业覆盖”通过企业级客户数量和落地行业数,体现了大模型在产业落地上的实力。

国内主流大模型,包括百度、阿里、腾讯、华为、科大讯飞、360、商汤、第四范式等14家厂商参与了本次评估。

大厂大模型的竞争咬合度很高,百度特点具有“芯片-框架-模型-应用”四层技术栈完整布局的独特优势:芯片层-昆仑芯、框架层-飞桨、模型层-文心大模型,以及各种AI的落地应用,其中百度自研的深度学习平台飞桨在大模型的高效训练和推理上提供了强有力的支撑。

阿里云,也很亮眼,12项指标获得6项满分,且是唯一获得“服务能力”满分的厂商。作为基础模型提供方,大模型厂商的平台能力、服务能力和生态合作水平对行业发展至为重要。阿里云在这三个指标上都获得了满分。

目前,阿里云的通义大模型家族现已具备处理或生成文本、语音和图片等多种模态的能力。过去3个月,阿里云先后推出了基础模型“通义千问”、音视频大模型产品“通义听悟”、 AI绘画创作大模型“通义万相”,通义大模型家族仍在不断迭代和进化中。

同为互联网大厂的腾讯云和京东云,都选择根据自身特色,深耕产业侧,发布行业大模型。

腾讯云在构建行业大模型的基础上,用自身数据进行微调,打造出数据精准性更高、隐私安全性更强的专属模型。

对于深耕数年供应链的京东来说,长期扎根于电商业务和物流业务,选择奔向产业大模型,专注于供应链是更好的选择。正如京东在言犀大模型发布会上所言,“只有将供应链做实,才能将大模型做实”。

科大讯飞等AI厂家在垂直赛道也拿到了满分,这些玩家在做透垂直行业上有机会,在厂商竞争中,垂直领域优势明显企业将领先。

以科大讯飞为例,科大讯飞专注人工智能领域20多年,多项核心技术均处于国际领先水平,星火大模型将大模型的语言理解能力、概括表达能力结合类搜索插件,有效解决了新知识难以更新、事实类问答容易“张冠李戴”等行业难题,实现了知识问答能力相比原来24%的提升。

由于训练大模型的成本极高,普通开发者和中小企业无从下手,这从报告结果也能看出:其他厂也很努力,但前途漫漫,说得更残酷些,可能连上桌吃饭的机会都少有。

三、大模型未来通往何方?

在前不久的WAIC大会上,入场大模型的玩家们其实已经划出了重点:首先解决技术问题,再是场景落地,最后实现商业与规模化。

目前,我们看到大模型已经开始与场景、行业进行深度融合,例如,代码生成、蛋白质结构预测等领域的大模型,验证了大模型已不仅在科技企业中应用,也迈出了走向各行各业的步伐。

国内大模型飞快跃过大模型概念股阶段,AI大模型已经从拼参数发展到拼应用。

比如,华为盘古大模型已经在气象、医药研发、电力、语种等领域落地,并交付了多个千亿参数大模型。腾讯云行业大模型能力将应用到金融风控、交互翻译、数智人客服等场景中,提升了智能应用效率,一站式MaaS服务为企业减负。

具体到应用场景,以金融领域为例,行业大模型可以加持金融风控解决方案,相比之前有了10倍效率提升。

大模型结合过往积累的多年黑灰产对抗经验和上千个真实业务场景,整体反欺诈效果相较于传统模式,提升了20%左右。企业则可以基于prompt模式,迭代风控能力,从样本收集、模型训练到部署上线,实现全流程零人工参与,建模时间也从2周减少到仅需2天。

即便样本积累有限的情况下,也可以完成快速搭建,跳过“冷启动”过程。

如何落地及商业化,正在成为厂商追求的重点。

这意味着,AI进入大规模可复制的产业落地阶段,仅利用下游的小样本或者零样本学习就可以达到很好的效果,从而降低AI开发成本。百度文心大模型在升级后,就成功将成本降至过去的10%。

任何行业,最终都会形成寡头态势,大模型也不例外。

过去短短几个月,大量新的大模型涌现,是疯狂想抓住风口,害怕掉队,还是长远布局赛道,潜心钻研,每位玩家只有自己心知肚明。

百模混战只会是一个阶段性的现象,终局仍然集中在少量的几个大模型。

原因不外乎以下几点:

  • 在演变过程中,各企业和机构逐渐找到了自己的定位,逐渐走向细分方向,最终被更完善的大模型收入麾下。
  • 需要多年积累。真正从底层做起来的大模型,成本非常高,需要非常综合的能力,在心态上也必须抱有绝对的长期主义,这就意味着没有绝对经济实力的玩家,会被甩在半路或者“死”在通往光明的路上。
  • 大模型在应用层面未来想象空间非常大。假设每一个行业都有巨大的发展空间,可以通过新AI技术提效,应用层面的价值一定会分流,依托几个头部大模型会有非常广泛的应用生态。

不可否认的是,未来所有的企业都会强依赖大模型,所有的产品都会基于大模型来开发。

而行业渗透率和市场份额,俨然成为企业大模型走向寡头最重要的挑战元素。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/59292.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

语音合成数据解决方案助您获取专属AI声音

在2020年小米开发者大会(MIDC)上,小米宣布小爱同学5.0正式上线。小爱同学在声音体验上做了很多创新,如奶萌泡芙童声、多情感语音、粤语合成、定制声音等。 在语音合成技术的支持下,小爱同学做了很多创新 小爱同学声音…

whisper 语音识别AI 声音To文字

whisper介绍 Whisper 是一个由 OpenAI 训练并开源的神经网络,功能是语音识别,能把语音转换为文字,在英语语音识别方面的稳健性和准确性接近人类水平。 1、Whisper支持语音转录和翻译两项功能并接受各种语音格式,模型中、英、法、德、意、日等主流语言上…

人工智能:通过Python实现语音合成的案例

今天给大家介绍一下基于百度的AI语音技术SDK实现语音合成的案例,编程语言采用Python,希望对大家能有所帮助! 注册百度AI平台应用 百度AI开放平台-全球领先的人工智能服务平台 首先登陆自己的百度账户,打开百度的AI开发平台页面 搜…

2023年,这几个AIOps新趋势不容忽视

文源自于公众号——布博士(擎创科技资深产品专家) 前言: 近年来,人工智能技术的研究和行业应用急剧上升。即使看起来人工智能技术似乎只是一种来自电影中的幻想,但无可否认的是人工智能技术已经在我们生活的各个方面得…

移动端(iOS,android)上那些炒股软件的K线图,分时图,都是怎么实现的?

具体回答网址: http://www.zhihu.com/question/30989362 类似的K线图有没有开源的控件?可以参考腾讯的自选股,百度股市通这两个进行说明。 添加评论 分享 按投票排序 按时间排序 7 个回答 20赞同 反对,不会显示你的姓名 臧其龙…

K线形态识别_下探上涨

写在前面: 1. 本文中提到的“K线形态查看工具”的具体使用操作请查看该博文; 2. K线形体所处背景,诸如处在上升趋势、下降趋势、盘整等,背景内容在K线形态策略代码中没有体现; 3. 文中知识内容来自书籍《K线技术分析》…

HQChart使用教程30-K线图如何对接第3方数据1

K线图如何对接第3方数据1 数据接口NetworkFilter说明K线图网路协议列表周期和复权全部使用后台数据小程序,及第3放app平台对接注意事项httpA股数据对接教程(付费文章)HQChart代码地址 数据接口 HQChart 提供一个网络协议过滤接口, HQChart请求数据前会调用这个网络…

Tradingview使用心得和使用教程 k线图的好工具

Tradingview是用来开发k线图的好工具,功能非常强大。此文章记录一些心得和坑。TradingView允许您在自己的网站上使用自己的图表库,并拥有自己的数据源。 1、vue集成jsapi和传统的html集成jsapi,代码逻辑上是不一样的。 2、如果开启了preset…

K线买入信号有哪些?

K线组合方式多种多样,对于国际现货贵金属投资者而言,如果能找到实战价值最高的看涨K线组合,就能更有效地捕捉到上涨行情中的做多机会。接下来,小编将分享了七种投资者必须知道的K线看涨的买入信号,肯定对大家盘感的增强…

房产中介、房屋租赁、房屋买卖APP(H5)

房产APP(H5),包含管理后台、移动端APP(H5) 后台管理模块包含功能 客户管理 客户列表,设置、查询客户基本信息等。 小区管理 小区列表,设置、查询小区基本信息,上传小区详情图&a…

房地产中介在未来会被取代吗?

房地产中介,既是一个劳动密集型行业,又是一个信息密集型行业。 “劳动密集”与“信息密集”貌似是一对儿矛盾的概念,可在房地产中介这里却和谐地统一在了一起。试想,当购房者面对、筛选令人眼花缭乱的海量房地产信息时&#xff0c…

技术专家的成功创业秘籍:怎样成为百万(美元)富翁?

曾经撰写过《Windows System Services》等专业技术书的 Marshal Bain,其实是位极为多才多艺的老兄。他创办的 How Stuff Works早已成为著名的内容型网站,获奖无数,而且成功为大公司收购,创业成功。他写的少儿科普图书 The Teen…

支付软件Venmo的101亿美元是怎么赚来的?

全文共3674字,预计学习时长10分钟 图源:unsplash 认真回顾近来的生活,我发现,似乎我使用Venmo来支付的情况比使用现金或信用卡还多。我用这个应用来支付房租、水电费、还朋友的钱,甚至都不用带现金。 从前,我只用信用卡。实际上,当确实需要用现金买东西的时候,我会觉…

1个人6种变现途径收入130万美金在2020年 - 人物志21篇

一个国外的独立变现创作者如何在业余时间实现了这样的复合性收入呢? $135k - 广告 $177k - 推广佣金 $182k - 赞助 $470k - 自学课程 $295k - 订阅课程 $71k - 社区 今天为大家介绍的Ali Abdaal(AliAbdaal),他主业是一名医生,业余时间做Youtu…

2011年遭VC疯狂追捧的13家科技创业公司

12月22日消息,据国外媒体报道,虽然2011年科技IPO市场走势低迷,但是对少数创业公司而言却是个好年头。VC们大手笔押注少数具有独特创意的公司,下文将盘点2011年最受VC追捧的科技创业公司。 1.照片分享和设计网站Pinterest(http://…

OpenAI的创始人World Coin项目介绍

🎯 在一个崇高的目标支持下,不停地工作,即使慢,也一定会获得成功。—— 爱因斯坦 如果你对项目感兴趣请联系v:weixin605405145 一、项目速览 项目背景 Worldcoin由OpenAI的创始人Sam Altman于2019年创立,就…

高频交易巨头GETCO的发达史

2012年8月1日,对美国的资本市场是“惊魂一天”,开盘后短短的45分钟内,许多股票都被不停地以高价买入,低价卖出,到收盘的时候,消息传来,骑士资本因软件技术故障,向纽交所发送大量错误…

Transformer作者出走谷歌创业,专攻通用人工智能,已获得6500万美元投资

丰色 发自 凹非寺量子位 | 公众号 QbitAI 最近,一家AI初创公司引起了不少人的注意。 在推特上宣布成立之时,有不少人为其点赞和转发。 一上来就要搞通用人工智能,什么来头? 我们看了一下它的创始人名单: Ashish Vaswan…

BCA Network&加密艺术NFT交易平台MetaOpus获200万美元天使融资

BCA Network及旗下加密艺术NFT交易平台MetaOpus(www.metaopus.co)获200万美元天使轮融资,由分布式资本和Zonff Partners领投,水滴资本和多位天使投资人跟投。 BCA Network是集加密艺术创作、交易、投资收藏和加密文化教育输出为一…

【Handshake】引发全硅谷投资机构额度大战的传奇项目

Handshake中文社区是由国内关注Handshake项目的爱好者自发组成的社区,旨在为大家提供Handshake最新资讯、技术的分享,您可以在这里自由的讨论以及交流。 ※ 项目名称 Handshake ※ 项目概念 去中心化域名认证协议 ※ 项目简介 Handshake是一条公链,专注于去中心化…