大模型竞逐,再造AI新格局

作者 | 辰纹

来源 | 洞见新研社

“面对AI时代,所有产品都值得用大模型重做一次。”

这是阿里巴巴集团董事会主席兼CEO、阿里云智能集团CEO张勇在2023阿里云峰会上对AIGC(生成式AI)进化的判断,在这背后则是由ChatGPT为起始点,而引发的大模型“涌现”。

其中,既包括正在中国大陆上发生的“百模大战”,科技大厂、创业公司乃至科研机构在过去的1个月时间内争先恐后的推出或宣布即将推出自己的大模型,也包括模型在突破某个规模时,出现了意想不到的能力。

图源:民生证券研究院

打响“百模大战”第一枪的是百度文心一言,随后华为盘古、360智脑、商汤日日新、阿里通义千问、京东灵犀、昆仑万维天工等大模型先后登场,后续还有腾讯混元、科大讯飞星火等大模型排队等着上线。

与此同时,美团联合创始人王慧文、搜狗创始人王小川、出门问问创始人李志飞等科技大佬重出江湖,并且带动了一批资金,开始了大模型方向的再创业。

拨开行业竞争中真假难辨的迷雾,在张勇的语境中,大模型要用怎样的方式来再造AI,对于每个参与者来说,如何才能拿到通向大模型时代的船票呢?

1.由价值驱动的“百模大战”

互联网是有记忆的,从“蔚小理”带起过的新造车大战,到滴滴快的带起过的网约车大战,从摩拜和ofo带起过的共享单车大战,再到如今由ChatGPT带起的“百模大战”,牵引着玩家扎堆入局的逻辑都是由价值驱动的FOMA心理。

“FOMA”是“Fear of Missing Out(错过恐惧)”的缩写,在营销领域特指一种营销策略,即通过制造“紧迫感”或“错过”的感觉,来促使人们参与某件事情。

大模型竞争中,参与者大多害怕错过行业起势的时间窗口,抱着“我可以不强,但不能没有”的心态上车,特别是由于包括GPT 3.5在内的大模型技术都已开源,进入门槛的障碍基本被扫平,更是吸引了大量的创业公司入局,抢着与科技大厂同时起跑。

当然,更大的内驱力还是来自于大模型的价值。

首先是来自资本市场的热炒,今年2月初时,东方财富上的“ChatGPT”板块还只有29只股票,到4月份就已经攀升到60多家。

随便点几个受益公司,360受AI、信创、数据安全和ChatGPT等概念持续轮动的影响,今年以来股价上涨超过150%,昆仑万维则从AIGC+游戏进一步拓展到“天工”3.5的发布,当前市值也较年初上涨超过260%。

更加夸张的是,华为盘古大模型4月8日发布前后,带动常山北明、川大智胜、拓维信息、麒麟安信等产业链公司股价集体上涨。此外像AI标签属性较强的科大讯飞、商汤科技在公布大模型相关业务布局后,今年股价也都有不错的表现。

东方证券就表示,ChatGPT题材是超越元宇宙、虚拟现实的大风口,资本市场今年可能会反复炒作。

大模型题材在炒作的过程中,不排除个别公司确实有投机心理存在,但对于科技大厂而言,更看中大模型对自身业务推动的价值。

比如,字节跳动无论是今日头条还是抖音,内容分发在其业务布局中处于绝对核心,其内容平台的属性同时又有内容生成的需求,这与大模型主要应用的匹配度极高。

一方面能够降低创作门槛,吸引更多的创作者加入平台,另一方面,内容分发的体验能够得到持续提升,字节跳动是不可能对大模型视而不见的。

阿里在发布通义千问时,张勇就表示,包括天猫、钉钉、高德地图、淘宝、优酷、盒马等在内的所有产品都要接入大模型,进行全面改造。

以最先接入通义千问的钉钉为例,在钉钉文档中,可借助通义千问自动配图、创作文章、撰写邮件、生成方案;在会议中,可以完成记录、总结、生产待办事项;甚至还能帮助总结未读群聊信息中的要点......

这些肉眼可见的进化,让钉钉进一步加深了在协同办公场景竞争的护城河。

从云计算业务的角度,BAT、华为、字节跳动这种体量的科技巨头算力资源是现成的,跟进训练自己的大模型顺理成章,如果大模型后续成长走在行业前列,在一定程度上也能对云计算业务造成正向推动,实现双赢。

微软为OpenAI大模型训练提供云服务的成功就在眼前,贴上全世界第一个训出GPT-4云平台的标签,或多或少会加深Azure在客户心中的印象,在与AWS 的拔河拉锯中为自己又争取了些许优势。

2.大模型竞逐,产业融合是评判标尺

回到大模型竞争的现实,如何才能在“百模大战”中胜出?

目前跑在前面的科技大厂给出的统一答案是与产业的融合,谁的速度更快,谁的成本更低,谁的竞争就更有优势。

事实上,在大模型“涌现”之前,AI一直在探索与产业的融合,特别是像计算机视觉、语音识别、自然语言识别这类识别型AI技术,普遍采用小模型来解决一些行业中的问题,像流水线上的工业质检、交通管理中的违章识别等都是AI识别的典型能力。

这些AI在产业中有落地,但渗透的速度很慢,很大一个原因就是,小模型确实能够很好的完成指定任务,但缺点也同样明显,一个AI只能解决一个问题。

闯红灯、超速、逆行等都是交通违章,若要识别这三种违章行为,则需要对这三个场景进行三次训练,由于不具备通用性,小模型的应用范围被限定在一个很小的空间内,同时落地成本也居高不下。这也是国内AI企业一直亏钱,财报业绩长期赤字的原因所在。

大模型的出现,给AI有了一次再造的机会,其方式就是用更快的速度融入到更广阔的产业土壤之中。

阿里宣布旗下所有产品都要接入通义千问的同时,也面向企业广泛邀请参与测试,在发布会当天,阿里云就宣布将与OPPO安第斯智能云联合打造OPPO大模型基础设施,基于通义千问完成大模型的持续学习、精调及前端提示工程,未来建设服务于其海量终端用户的AI服务。

同时,中兴通讯、吉利汽车、智己汽车、奇瑞新能源、毫末智行、太古可口可乐、波司登、掌阅科技等多家企业也表示,将与阿里云在大模型相关场景展开技术合作的探索和共创。

在通义千问之前,百度的文心一言也是将B端“生态圈”作为宣传和业务重点,华为云盘古大模型则提出了“AI for Industries”理念。

曾有机构对BAT和华为大模型的核心差异做过总结:

百度:文心大模型涵盖基础大模型、任务大模型、行业大模型的三级体系,打造大模型总量约40个,产业应用覆盖了电力、燃气、金融、航天等行业。

腾讯:大模型产业化应用方向主要为腾讯自身生态的降本增效服务,其中广告类应用表现出色。

阿里:M6大模型基于阿里云、达摩院打造的硬件优势,可将大模型所需算力压缩到极致;另外其底层技术优势还有利于构建AI的统一底层。

华为:训练出业界首个2000亿参数以中文为核心的预训练生成语言模型。目前发布了盘古气象大模型、盘古矿山大模型、盘古OCR大模型三项较为重磅的行业大模型。

很显然,各家的特点都很鲜明,呈白花齐放之势,但万变不离其宗,产业融合是唯一共识。

事实上,在大模型的影响下,有些行业已经开始发生变化。

4月12日,蓝色光标发布邮件,决定无期限全面停止创意设计、方案撰写、文案撰写、短期雇员四类相关外包支出。此前,蓝色光标曾宣布将接入百度文心一言的能力。

更早之前,心动游戏CEO黄一孟发文说,已有游戏团队把原画外包和翻译外包团队砍掉,当人类被替换,大模型已经开始对行业产生实际影响了。

3.云计算的现在与大模型的未来

如今,大模型的竞争混沌初开,创业公司与科技巨头同台竞争,市场的最终走向将会如何?参照云计算的发展过程,我们或许已经找到答案。

众所周知,云计算市场在海外有AWS(亚马逊)、Azure(微软)和GCP(Google)三巨头,在国内则有BAT和华为,之所以是科技巨头成为云计算的绝对主角,主要在于云计算的特点,需要达到一定的规模才能产生边际效应,而在此之前,需要投入大量资源进行基础设施建设。

阿里云直到成立13年后,才在2022财年首次实现年度盈利,在其背后是遍布全球的上百个数据中心与超200万台服务器构建的云服务基础设施体系。

与云计算类似,大模型也需要耗费大量的算力资源与海量的数据成本,曾有机构估算,OpenAI训练GPT-3的成本为几百万到千万美元;训练GPT-4时,调用了上万片英伟达A100显卡,耗费的成本大约为数千万至一亿美元。

随着GPT的迭代,其训练花费将成指数级增长,有传闻,百度在训练文心一言时,调用了几乎所有的A100显卡,由此可见,大模型终究也将是少数人的游戏。

出门问问创始人李志飞在接受媒体采访时,也表达过通用AI大模型有时间窗口的观点,“人才壁垒、时间壁垒、数据壁垒、资金壁垒一旦建立起来,小的团队就没有戏了。”

李彦宏说,“重新做一个ChatGPT没有多大意义,基于语言大模型开发应用机会很大,但没有必要再重新发明一遍轮子”,表达的也是同样一个意思。

话已经说到这个份上了,大模型创业还有机会吗?半导体行业的一些有趣现象或许可以打开我们的思路。

英特尔一直在孜孜不倦的尝试突破摩尔定律的物理极限,经常会花费数倍于前一代产品的成本来推动CPU的更新与迭代,市场上经常会出现新一代CPU的价格是上一代产品的10倍,甚至百倍的情况。

追求性能的用户固然会追捧新一代CPU,可是在巨大的价差面前,仍然会有相当数量的用户选择使用上一代产品。

同样的道理,GPT-3和GPT-4在训练成本上有差距,同时随着大模型向前进化,训练成本的差距会更大,科技巨头探索在大模型的最前沿,在其身后会存在若干有代差、精度要求较低、“够用就行”的大模型,而这或许就是创业公司的机会,在成本、市场需求、技术进步的三者之间找到平衡,不断调整策略。

另外一个方面,深入行业的垂类大模型也值得一试,王小川表示,尽管垂类模型的通用性没法与OpenAI抗衡,但可以通过针对具体场景优化,在细分场景里达到与OpenAI相近的效果,从而积累用户、构建起生态,跑通小闭环。

关于大模型创业,360创始人周鸿祎就很乐观,“中国不会只有一个大语言模型,将来每个行业,企业甚至每个人都有自己定制的GPT大模型。” 

4.结语

从长期来看,大模型是一场持久战,因而无论是现在入局,还是几个月或是几年后再入局,在本质上并没有什么区别,大模型竞争的核心不是抢速度,争第一,而是要沉下心来想清楚,在这场长跑中如何分配体力,如何获取资源,顺顺利利的跑到终点。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/25700.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

第六届云安全联盟大中华区大会:数字技术引领数字安全生态建设,成功举办!

第六届云安全联盟大中华区大会:数字技术引领数字安全生态建设,成功举办! 更多大会详情可微信搜索“国际云安全联盟公众号” 2023年4月13日,第六届云安全联盟大中华区大会(The 6th CSA GCR Congress)在上海…

语言大模型的进化轨迹

ChatGPT的发布是语言大模型(LLM)发展史的转折点,它让人们意识到LLM的潜力,并引发了“AI竞赛”,世界上主要人工智能实验室和初创公司都参与其中。在这之后,基于LLM的聊天机器人层出不穷。 ChatGPT及相关LLM模…

GPT-4 遭投诉要求禁用,OpenAI 为何成为众矢之的?

整理 | 屠敏 出品 | CSDN(ID:CSDNnews) ChatGPT、GPT-4 的迅速“出圈”,让 OpenAI 一战成名,外界对这家公司的关注度达到了前所未有的高度。 然而, 欲戴王冠,必承其重。在如此前沿的技术到来之际…

无法拥抱新技术?吴 军:ChatGPT不算新技术革命,带不来什么新机会

转载自 | 学人Scholar 吴军,1967年出生,毕业于清华大学和约翰霍普金斯大学,计算机专业博士,前Google高级资深研究员、原腾讯副总裁、硅谷风险投资人。 4月3日晚上,得到直播间邀请到了计算机科学家、自然语言模型专家吴…

ChatGPT 未来会拥有自我情感和思维吗?

目前人工智能领域的专家和学者普遍认为,即使在未来,也很难确切地预测人工智能是否会产生真正的自我情感和思维。虽然人工智能系统可以在某些任务上表现出人类智能的某些方面,但是它们仍然无法像人类一样真正地感受情感或自主思考。 在目前的…

微软受冷落:遭遇传统合作伙伴“大叛逃”

关于微软即将升级到win8.1系统是不是微软承认了自身的win8系统的失败的讨论还未远去。但是这根微软的PC合作伙伴的关系却貌似不怎么大。 虽然微软不管是传统PC还是移动互联领域都积极布局,但是依然遭遇传统合作伙伴的“叛逃”。 对于微软而言,未来可能没…

微软CEO发话:今年停止加薪并减少奖金,网友:总比失业好!

整理 | 朱珂欣 出品 | CSDN程序人生(ID:coder_life) 5 月 10 日,据 CNBC (美国消费者新闻与商业频道)报道 ,微软 CEO Satya Nadella 的一封电子邮件告知员工:微软今年不会为全职员…

微软推进万人裁员计划,砍掉 AI 部门整个道德和社会团队!

整理 | 朱珂欣 出品 | CSDN程序人生(ID:coder_life) 自去年起至今,硅谷科技公司掀起“瘦身”潮可谓是一波接着一波。 据裁员数据统计网站统计,截止去年 11 月,美国科技行业裁员人数突破 10 万人&#xf…

【PHP实现微信公众平台开发—基础篇】第2章 微信公众账号及申请流程详解

第2章 微信公众账号及申请流程详解 本章主要介绍微信的结构和各个角色之间的关系,并对不同类型的公众账号的功能进行对比讲解,帮助大家在实际开发中快速选择适合的公众账号类型,最后详细演示申请公众账号的流程,解决大家在申请过…

chatgpt赋能python:Python怎么装插件

Python怎么装插件 Python是一种高级编程语言,它拥有一个庞大的生态系统和强大的社区支持。作为一门非常灵活的语言,Python的用户可以通过安装插件来扩展其功能。本文将向您介绍如何在Python中安装插件。 什么是Python插件? Python插件是用…

chatgpt赋能python:Python插件安装指南

Python 插件安装指南 介绍 Python是一种广泛使用的编程语言,并且有许多强大的库和插件可供使用。通过安装这些插件,开发人员可以扩展Python的功能,使其更适合他们的项目。在本文中,我们将介绍如何安装Python插件。 第一步&…

写作如闪电般高效:揭秘UseChatGPT插件的速写技巧!

安装plugin 1、应用商店。 2、搜索“UseChatGPT” 3、安装。 注意:第一次使用,插件会指引你打开chat.openai.com的chatgpt的帐号,并登录系统,切记不能关闭登录后的页面,并一直保持打开状态,这样可以保证插…

品牌战略规划:如何让你的品牌脱颖而出

虽然很多国内企业家都非常重视战略,什么商业战略、渠道战略之类的一通研究,但惟独却缺乏对品牌战略的一个正确理解。 很多时候一把手不参与,也不关心品牌建设,经常上来就让团队实操动作,而自己只看最终结果&#xff0…

万字长文:可能是全网最晚的ChatGPT技术总结-1

作者:邱震宇(华泰证券股份有限公司 算法工程师) 最近ChatGPT可以说是火遍了全世界,作为由知名人工智能研究机构OpenAI于2022年11月30日发布的一个大型语言预训练模型,他的核心在于能够理解人类的自然语言,…

chatGPT对软件测试人员的冲击和影响

目前大家都清楚类似chatGPT生成式人工智能的解决方案的大热,作为软件测试人员,或者相关行业的从业人员,需要思考的问题是,我们需要怎样持续学习来应对这种产业升级或者是类似新的技术迭代。 据我的感觉类似chatGPT的人工智能已经对…

信息检索与智能客服技术

目录 一、信息检索(Information Retrieval,IR)概要1.1 概述1.2 基本方法和模型1.2.1 标引(表示模型)1.2.2 相似度计算(匹配模型) 1.3 基于representation learning的深度匹配模型1.3.1 基于 DNN…

Hugging Face简介

1、自然语言处理究竟要做一件什么事呢? 大家可能经常听到分类,机器翻译,情感分析,智能客服,摘要与阅读理解等想一想我们在长大的过程中,如何来学习语文的呢?难道只是上课背考试题吗?我们语言能力的学习源…

OpenAI文档翻译——搭建第一个自己的ChatGPT应用

这篇主要是讲了重头到位创建一个基于OpenAI API的应用程序的过程,同时给出了Node.js、Python版本的实例代码。应用程序的构建总体来说是很简单的就是一个接口调用,前提是我们需要提供密匙。 如果想要获取更好的结果返回一个是可以给模型提供一些列子从而…

Mac如何下载Rocket.chat软件

公司使用Rocket.chat作为沟通工具, 用Mac的我软件一直安装失败 错误操作如下 使用App Store下载,下载的软件无法打开 正确操作如下 1.去github网站找安装包 https://github.com/RocketChat/Rocket.Chat.Electron/releases 2.找到自己需要的版本&#…

Hello Ai Chat for Chat GPT for mac(人工智能Chat GPT聊天工具)

Hello AI Chat for Chat GPT是一款基于GPT技术的聊天机器人应用程序,它可以通过人工智能技术理解和回复用户的问题。 Hello AI Chat for Chat GPT的一些特点: 智能回答:Hello AI Chat for Chat GPT基于GPT技术,可以理解和回答用户…