文心一言迭代数据曝光,QPS提升10倍,留给大模型创业玩家的涌现时间不多了...

杨净 发自 凹非寺
量子位 | 公众号 QbitAI

文心一言上线内测一个月后,首份迭代数据曝光:

  • 一个月共迭代4次;

  • 模型推理效率提升10倍,最近一次带来的推理提升达到123%;

  • 推理性能提升50%,模型算力利用率提升1倍。

简单归纳就是说,迭代很快、不仅成本降下来了,顺便还把性能提升了?!

d9b99c829739407140f03986ab78ec00.jpeg

要知道过去一个月内,全球网友们的热情被这场技术风暴所点燃,人们玩得不亦乐乎,ChatGPT也overload了好几次。

作为国内率先发布的文心一言,是如何保持住高效迭代的?

在这份成绩单中,找到了答案。

文心一言首月数据曝光

曝光的数据不多,但全都是关键技术指标——

大模型训练与推理方面的数据,直接影响后续产品体验效果的好坏。

首先,迭代方面。百度飞桨支撑的大模型推理服务在4月19日再次迭代,搭载了支持动态插入的分布式推理引擎。据消息称,这还是业内首创。

截止目前,已迭代至3.5版本,一个月共迭代4次。

7b69f72f0b2f418ae93969b19f821a07.jpeg

具体到推理方面,QPS (每秒查询推理响应速度)提升10倍,模型推理性能提升50%,模型算力利用率提升1倍。

QPS (每秒查询推理响应速度)提升10倍,也就代表着是大模型推理效率的提升,推理成本降低为原来的10分之一。换言之,在同等成本情况下可以为更多用户提供服务。

模型推理性能提升50%。大模型需要在用户反馈中持续不断的学习,推理作为大模型应用的关键,其性能的提升直接影响到产品侧的效果。

算力利用率提升1倍,同样也是降本增效的体现。

事实上,不管是迭代速度,还是从模型成本、性能以及效率等多方面的提升,而这背后文心一言之所以能够高效迭代,飞桨的重要性不容忽视。

更确切地来说,「飞桨+文心一言」联合优化。

大模型不仅需要单纯的「暴力美学」的支撑,同时还需要深度学习框架作为底层来支持高效、稳定的分布式训练。

此次数据就可以看到,飞桨即向上与模型「文心一言」,又向下与芯片算力都实现了协同优化,实现整体的效能提升。

而具体到推理过程,飞桨能为文心一言“定制”了一个精密生产流程,结合大模型算力、数据、参数量等特点来设计工艺,从而提升了推理效率和性能,帮助模型学习得越快越好。

大模型技术行业挑战

这些迭代数据的背后,带出了大模型技术的新行业挑战值得探讨。

随着更多产业玩家的推进,我们已经明显感知到大模型投入大成本高。如果没有足够的资金和计算资源,就连开发训练这一阶段都难以进行。

据最新消息,OpenAI每天需要支付70万美元来维持ChatGPT基础设施运行。在此之前微软也已经从中投入了数十亿美元。

诚如每每有行业大佬选择大模型创业,都有网友调侃:这点钱不够烧的。

37e231c532eba40748be046b246b4066.png

其次,大模型优化难迭代要求高,需要自上而下的全局优化

以往认知中,大模型核心技术突破来源于暴力资源累积,可以是超大规模计算资源的聚集、超大规模模型结构的设计、海量数据亦或是参数量的提升……

但事实上这牵涉到每个环节自上而下很强的经验积累。

诚如OpenAI有业内人士消息称,它将整个公司最优秀的算法研究员,拿去做数据规划和处理。

现在在百度文心一言,也得到再一次印证:

大模型的突破和迭代,并非靠简单三驾马车(算力算法数据)来驱动,而是一整套从底层芯片框架到模型训练推理等流程的系统工程化难题。

与此同时在这份数据中,也透露出了百度的经验解法:

全局技术栈,端到端优化。

早在文心一言启动邀测时,李彦宏就已经披露,百度将目前已有的AI技术栈自上而下分成了四个方面:应用层、模型层、框架层与芯片层。

c23a0dbe704bb7748b111d87350c359f.png

四层架构之间端到端优化,进而来实现降本增效。此次飞桨与文心一言的联合优化,正好就是这套解法最直观的展现。

飞桨之于文心一言,一方面其开源分布式架构,可以支持模型大规模GPU并行训练,以提升模型的性能和效率。另一方面,连接了芯片层与模型层,将整套流程设计得更加精密和适配。

甚至业内人士这样形象化地形容:

大模型就像汽车的发动机,要压榨出发动机瞬时最大爆发力(QPS)以及最优的性能表现。

深度学习就像是发动机的动力源“变速箱“,可以让发动机整体部件组合更精密、动力更强。

更关键在于,如果这几层技术栈都是自主自研,那么协同合作就会更高效,效率提升也会更加明显。

这些又意味着什么?

最后,在这些行业挑战和百度经验解法之中,也透露出了大模型发展的几大趋势。

首先,大模型想要跑得快跑得稳,必须端到端优化。

OpenAI的成功一方面可以归结于自身的人才技术以及长期投入,另一方面微软从框架到算力的支持,也在其中做出了关键贡献,这才有了持续惊艳全球的ChatGPT。

只是当时这种端到端优化的范式没有被太多强调关注。而此次曝光的文心一言数据,则是更广泛地证明了端到端优化的优势。

以往大家所关注到的是大模型训练中算力、算法以及数据的必要性。但底层比如深度学习框架,对大模型训练推理的重要作用也应该被大家所广泛感知。

其次,端到端优化的趋势,也正在改变大模型赛道游戏规则。

ChatGPT风暴席卷而来,巨头们纷纷进场,大佬们前后脚创业,大模型人才被哄抢,每周都有上千个AI应用涌现……每个躬身入局的机构都在金钱、时间等方面进行抢夺与追赶。在大模型的创业浪潮中,有人把入场券门槛认为5000万美元,窗口期大概在半年到一年。

但现在这种端到端优化趋势,正在让创业窗口期越来越短。

原因无他,大模型雪球效应已经开始展现

以百度为代表的大模型玩家,正在形成“架构-大模型-应用-数据”飞轮加速闭环。一方面,推理成本降低,加速大模型产业落地,甚至可能比上一波浪潮更快;另一方面,大模型迭代速度越来越快,产品应用具有长期持续性,商业壁垒更容易建立,对下游生态玩家而言,这自然是刚需和利好。

但与之相关,大模型创业甚至产品发布的窗口期也正在被压缩,留给大模型创业玩家的涌现的时间也不多了——

他们不光要准备金钱、时间等这些外在资源储备,还需要考虑自身产品能否还具有竞争力。另外创业的必要性也正在减弱:就动辄大几千万甚至上亿的入场券来说,既没有必要重复造轮子,也没有端到端核心积累优势。

大模型创业的机遇,会开始朝着生态和应用创新倾斜

但也正因如此,反而更加彰显了大模型自主的重要性,因为太基础、太底层、太需要把生态放在放心安心的国产层面了。

大模型趋势再明晰不过,千行百业的落地价值也已经预见,入局是必然,但之前是否需要按照地缘区域或国界划分“造轮子”却没有共识——有些论点里,依然相信科学技术的进展会普惠到全世界。

然而随着地球另一边,OpenAI越来越Close,API输出的区别对待,中国需要自己的大模型底座,正在成为共识。

b29be2b81e6e804106778f8c4bace979.png

有意思的是,这在芯片、深度学习框架、底层架构平台的打造过程中,已经有过一轮讨论,有过一轮经验教训,并且还被类比为了汽车产业中的“发动机”,最后明确“发动机”必须要自主,这样产业才真正安全。

然而到了大模型竞速中,对于“变速箱”的认知,之前因为对大模型认知不完备,存在不同声音,但此役过后,应该无人再有异议了。

毕竟百度已经在打造、迭代的过程中,展现出了这种四层自研技术栈的端到端协同的必要性和重要性。

不过也正是这种必要性和重要性,进一步明示了大模型打造的残酷的游戏规则:

凡有的,还要加倍给他,叫他多余;没有的,连他所有的也要夺过来。

这背后既是端到端全栈带动的壁垒,更是数据、应用驱动飞轮之下越滚越大的雪球。

随着雪球向前,大模型产业落地的速度自然会加快,同时留给其他大模型玩家涌现的时间也越来越紧缺。

这种趋势已经开始,这种趋势还会持续。

《中国AIGC算力产业全景报告》征集倒计时

AIGC算力需求爆发,谁将在此次算力产业变革中脱颖而出?

量子位《中国AIGC算力产业全景报告》《最值得关注的AIGC算力玩家》征集即将截止,欢迎更多优秀的机构、产品、技术案例与我们联络 ~

fa4a994afd9effe6fa37fe9bb98ef135.png

点这里👇关注我,记得标星哦~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/48531.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

华为大模型,亟需回到大众视野

作者 | 山竹 出品 | 锌产业 在刚刚过去几个月里,人工智能在大众应用层面得到了空前涌现。 尤其在微软、谷歌、Facebook、Adobe等科技巨头推波助澜下,AI生成文本、AI生成PPT、AI作画、AI抠图…… 相信这段时间不少人会和我一样,会对AI产生一种…

搜索技术理论之父出生 | 历史上的今天

整理 | 王启隆 透过「历史上的今天」,从过去看未来,从现在亦可以改变未来。 今天是 2023 年 3 月 8 日,在 1857 年的今天,美国纽约制衣和纺织女工举行了首次大型抗议活动。妇女节是纪念妇女权利运动的国际性节日。设立国际妇女节的…

全渠道定价、库存决策,混合整数规划建模求解,MNL选择模型,内附代码!

1. 文章信息# 基本信息 (1)发表期刊:Transportation Research Part E(10.047/Q1,运输领域的good good刊 ૮ ͈ ᗜ ͈ ა♡) (2)标题:Fulfillment and pricing optimizati…

让我们一起来了解什么是人工智能吧

前言 最近这几年”人工智能“相关的话题热度一直很高,1997年5月11日深蓝战胜当时的国际象棋世界冠军卡斯帕罗夫, 2017年5月27日 AlphaGo战胜当时的围棋世界冠军柯洁,一次又一次让世人感到震惊,再到如今爆火出圈的ChatGPT。笔者也一…

悉尼大学计算机研究生学制,悉尼大学研究生一般读几年?九大领域研究生学制盘点!...

悉尼大学是澳洲最知名的八大院校之一,该校的研究生课程备受留学生青睐,以下是悉尼大学九大领域的研究生学制详情: 一、Architecture、design and planning建筑、设计和规划 研究生学制—— 研究生证书课程为0.5年制,研究生文凭课程…

悉尼科技大学计算机科学,悉尼科技大学计算机专业

原标题:悉尼科技大学计算机专业 悉尼科技大学计算机专业 悉尼科技大学的信息技术专业能让学生在技术和管理领域获得全面和深入的理解。本专业有多个方向,可以满足学生的职业发展的需求。当今时代拥有IT知识和技术是至关重要的,本专业能加强学…

悉尼大学计算机硕士健康科技,悉尼大学健康科学学院

悉尼大学健康科学学院的前身是辅助医学研究学院,成立于1973年。该学院主要针对物理治疗,职业病治疗,以及语言 病理学三个学术领域提供高等教育课程。并且在1975年, 将NSW College of Nursing的高级护士注册课程也纳入学院的课程作…

悉尼大学计算机科学硕士专业,悉尼大学计算机硕士

原标题:悉尼大学计算机硕士 介绍,悉尼大学是澳大利亚第一所大学,其信息技术(IT)学院因致力于精英教育和创新研究而备受尊崇,并晋身工程和技术专业世界排名35之列。根据当前各行业对高级信息技术人才的广泛需求,该大学通…

悉尼大学计算机科学专业,悉尼大学计算机科学专业怎么样

悉尼大学计算机科学专业为计算机科学方向。基于扎实的计算机科学和数学方面的基础知识,学生能够对现代计算机系统有比较全面且深刻的理解。在该专业的学习中,学生将学习到该行业的计算机设计、研发、安装、集合与维修等必备的技巧。该专业分为三大专攻方…

悉尼大学计算机科学专业,悉尼大学计算机科学专业

悉尼大学计算机科学专业为计算机科学方向。基于扎实的计算机科学和数学方面的基础知识,学生能够对现代计算机系统有比较全面且深刻的理解。在该专业的学习中,学生将学习到该行业的计算机设计、研发、安装、集合与维修等必备的技巧。该专业分为三大专攻方…

悉尼大学计算机录取要求,悉尼大学录取要求

原标题:悉尼大学录取要求 悉尼大学按照专业不同,录取要求也不尽相同,具体录取要求如下,1.商科方向,学术,985院校75%,211院校75%,双非83%,语言,雅思7单项6,托福…

悉尼大学计算机一年制硕士,悉尼大学一年制硕士

澳洲也有许多学校开设了一年制硕士课程,悉尼大学就是其中之一。悉尼大学的一年制硕士课程有Master of International Business,.Masterof EducationMaster of Engineering等。 悉尼大学一年制硕士课程介绍 1、Master of International Business 学制&…

Speech and Language Processing-导读

朋友们,最近打算做一个大工程,我曾多次提过,chatgpt未来将是一股非常大的信息技术革命,有的人不以为然,或者国内很多企业好像并不是很重视,以我从业多年来的经验,chatgpt与之前的NLP技术有着较为…

PDFgear——一款接入AI智能化模型的免费PDF聊天软件

目录 一、前言 二、产品介绍 2.1、PDFgear是什么? 2.2、PDFgear能做什么? 2.3、技术规格 三、产品安装 四、功能介绍 4.1、PDF聊天 4.1.1、支持和PDF进行聊天 4.1.2、支持上传多个PDF对话 4.1.3、始终保持会话不会丢失 4.1.4、完全免费和PD…

区块链技术在金融领域的应用与思考

ChatGPT狂飙160天,世界已经不是之前的样子。 新建了人工智能中文站https://ai.weoknow.com 每天给大家更新可用的国内可用chatGPT资源 一、区块链技术的特点及市场情况 区块链技术作为一种分布式记账技术,其最大的特点是去中心化。这意味着所有参与者可…

【CICC原创】面向智能博弈的决策Transformer方法综述

来源:中国指挥与控制学会 (《指挥与控制学报》刊文精选) 引用格式 罗俊仁, 张万鹏, 苏炯铭, 等. 面向智能博弈的决策 Transformer 方法综述 [J]. 指挥与控制学报, 2023, 9 (1) : 9-22. LUO J R, ZHANG W P, SU J M, e…

2023年4月的12篇AI论文推荐

GPT-4发布仅仅三周后,就已经随处可见了。本月的论文推荐除了GPT-4以外还包括、语言模型的应用、扩散模型、计算机视觉、视频生成、推荐系统和神经辐射场。 1、GPT-4 Technical Report Sbastien Bubeck, Varun Chandrasekaran, Ronen Eldan, Johannes Gehrke, Eric…

OpenAI API调用

上次简单写了一篇对ChatGPT的一些看法,最近想深入研究一下。 极客时间上有个课程《AI大模型之美》,看了一下还可以。当做入门是不错的,但还是有很多细节可以打磨,不过毕竟是在风口上的课,也能接受。 本次演示如何调用…

B+G双轮驱动,税友股份迎来数字化东风

配图来自Canva可画 不知不觉之间,国内的数字经济已经蔚然成潮。据相关部门的统计数据显示,去年国内数字经济规模已经达到了50万亿,占到了国内GDP总量的40%以上,增速更是持续领先于GDP增速。与此同时,随着数字中国战略…

Controller 层如何写才能简洁又优雅!

更多内容关注微信公众号:fullstack888 一个优秀的 Controller 层逻辑 说到 Controller,相信大家都不陌生,它可以很方便地对外提供数据接口。它的定位,我认为是不可或缺的配角。 说它不可或缺是因为无论是传统的三层架构还是现在的…