通用智能面临巨大掣肘,国产AIGC还在寻找光明

410d2443c1174cc787e9b054c651db22.jpg

 

无论技术有多先进,符合商业规律才能笑到最后。

@数科星球 原创

作者丨苑晶  编辑丨十里香

AI­GC背后充满了故事,在一家家企业手握巨额融资之时,人们耳边再次响起了警钟。诚然,在新的浪潮之下,符合商业规律的企业才能笑到最后。在国外竞品大踏步前行之际,国内的通用智能企业境遇如何?

前景很乐观,但当下似乎并没那么好过。

01

来自Op­e­n­AI的压力

似乎Op­e­n­AI的进步更快。

“我觉得我们和Op­e­n­AI的差距越来越大了”,一位AI­GC从业者对数科星球(ID:di­g­i­t­al-pl­a­n­et)这样表述。前些日子,在Ch­a­t­G­PT推出后,不仅是英文对话,在中文领域,该系统的用户体验也超越了国内的众多产品。以至于,一时间,人们的朋友圈被Ch­a­t­G­PT的对话刷屏。

“最早,我测试过一些特殊的中文语境,Ch­a­t­G­PT表现不好,不过最近我在测试的时候发现它进步很快”,这位技术人员曾以诸如“关公战秦琼”等有中文历史背景的话术测试机器人,他发现,最近这款产品在中文适配方面有了明显进步。

赤裸裸的对照实验结果出现后,技术派的内心是焦虑且复杂的。一些国内企业对我们表示,以目前的进度来看,光是追上Op­e­n­AI,就感觉“很吃力”。

虽然,目前Op­e­n­AI的终端产品由于众所周知的问题未在国内市场全面铺开,但对于具有技术理想的相关企业来说,这种滋味是十分难受的。有人将这种情况描述为北斗未出现时的导航行业,“从信创的角度考虑,中国的AI­GC是肯定要有的,但技术差距也是不可忽视的”,一位投资人评价道。

客观来说,造成国内AI­GC落后于同行的原因是多方面的:有A100显卡的获得受到制约、国内人才队伍发展较慢等诸多原因。其中,在硬件方面,大模型训练过于依赖进口GPU显卡,虽行业间出现了便宜的国产替代品,但以目前的技术水平,还不能给出满意的性能支持;而在人才队伍方面,一些行业人士称“算法工程师多,但会大模型的凤毛麟角”。

全局来看,当下,似乎仅有百度公司、清北高校等团队立志于全身心投入于此。大模型所谈者甚多,但行业“孤勇者”数量寥寥。

02

国产AI­GC的进击障碍

摆在通用智能或大模型发展之路的另一个障碍是小模型。

我们在文章中所提到的“大模型”概念是一个术语。之所以称之为大模型,因其在训练数据过程中引入多模态等数据,让数据标注的数量大规模增加,使之展现可打破行业藩篱的普适性。相对于小模型而言,具有通用性好、边际成本低、效率高等特点。

后来,Op­e­n­AI再次点燃人们对通用智能的期待。在一些具有前瞻思维的技术派眼里,大模型对于各行各业的影响将是摧枯拉朽式的,他们一致认为大模型是“当之无愧”的未来发展方向。也就是说,技术上,大模型的发展上限更高,其会在未来某个时间点达到各种小模型的用户体验阈值。

由于大模型的横空出世,小模型统治AI的格局被打破。应该说,就本质而言,两种技术路线背后代表着不同的利益。以至于,互联网上,网友对两种技术路线的讨论十分热烈:一会有人指责大模型是“大炼钢铁”,一会又有人攻讦小模型是“亚当斯密小作坊”式的抱残守缺。

客观来说,小模型在当今的市场竞争中仍然具有重大影响:从业者们通过算法微调、反复训练数据等措施下,一些产品收到了不错的效果,对于客户而言,甚至在一些领域内的结果要好于大模型产品。

其次,国内通用智能的AI­GC缺少数据训练场景。

类似Ch­a­t­G­PT的训练场景尤为缺乏。在上文提到过的,这款产品之所以短时间之内进步神速,因大量用户为其充当了免费的数据标注员。不过,已目前情况来看,可与Ch­a­t­G­PT相较的数据训练场景在国内还鲜有见到。

另外,产业界对大模型有着浓烈的观望情绪。

在对谈多家相关企业后,数科星球(ID:di­g­i­t­al-pl­a­n­et)发现了产业界对AI­GC持观望态度的主要原因。概括来说,业界普遍存在这样的忧虑:目前大模型应用不成熟,骤而上马将会对原有业务造成冲击。

以电商售后和银行电话客服场景为例,目前行业内仍采用主流智能客服公司推出的QA问答库技术。客户企业希冀大模型产品能够解决QA库无法承担的长尾问题,覆盖到检索式问答路径无法涉足的领域,但金融行业的语料库等数据又不对外开放,让大模型企业不得不重头开始。

这都延迟了大模型进军具体行业的时间表。

目前,一些从业者透露,金融科技公司愿意为大模型企业提供“必要但不致命”的应用场景。在这些场景中,客户企业可以承受一定程度的容错,也愿意投入时间和资源支持大模型的进一步发展。“我们的主要客户来源于金融机构的创新部门,因为他们支持一些通用智能的事情”,一位销售人员对数科星球(ID:di­g­i­t­al-pl­a­n­et)这样说。

“死马当活马医,反正没办法解决长尾,不如让大模型试试”,这是金融行业业内给出的真实看法。甘愿“冒风险试一试”的场景有公文写作、情感理解等。

总结而言,通用智能企业需要客单价高、数据训练场景丰富的派单需求,但这个问题又与企业的现实考量和预算投入相互矛盾。

没得数据用来训练、没得大钱(投资除外)养活产品,是摆在现实的两大难题。

03

国内AI­GC的扩散难

元宇宙爆火,燃遍各行各业。它能否成为助力通用型AI­GC扩散的有力平台?

这是一个有趣的想象。答案是,可以,但很难。

目前,AI­GC和元宇宙的发展虽然存在相关性,不过就目前的情况来看,二者还未完全合流,处在“你做你的、我做我的”的阶段。

举例来说,在一些社群中,我们曾讨论这样的使用场景:在在线绘画App中嵌入AI­GC功能,使用户在提交绘画作品后自动生成AI­GC图片。面对这个问题,某些供应商对数科星球(ID:di­g­i­t­al-pl­a­n­et)分享:“实际上,在第三方App中嵌入AI­GC难度很大,要有能力处理高并发,要低延时,从而不影响用户体验”,在他的想法中,甲方的需求可以满足,但如若在实时在线的基础上,成本颇高。

退而求其次,供应商给出了离线生成或自建图库的方式满足需求(自建图库是预先在系统保存大量已经生成的图片,用户有需求时直接调用)。但很明显,这种折中的方式违背了AI­GC设计的初衷。时间长了,对于训练大模型更是无从谈起。

在同样爆火的数字人中,AI­GC的应用场景也不算多。目前,市面上绝大多数数字人均属“服务型数字人”。它们被广泛应用在虚拟的办事大厅、博物馆、手语电视台的手语节目等场景之中。

剖开数字人产业链可以看得更加直观:在这个产业链中,底层为算法层,负责驱动面部表情和手势动作;中层为渲染层;上层为构成层,负责建立数字人图像。但除了底层“数字脑”领域,其他层面与通用智能结合较少。

在某知名投资机构投资人看来,“未来的数字人会相当多”,他认为,人们会拥有具有服务和陪伴属性的虚拟分身。但在技术上,想让人工智能具备情感陪伴功能还尚需时日,“至少目前技术是达不到的”,一位技术人员补充说。

整体来看,目前的数字人大多承担着IP形象功能,能说话的数字人还比较少。在一些先进的数字人中,“中之人”又是必不可缺的因素(其承担动作捕捉、虚拟拍摄、表情抓取和后期合成、渲染精修等工作的真人)。表面上,这种数字人比较高端,但其背后通常有大量人员为其服务,制作成本虽有所降低,但整体制作成本也并不低廉。

以上原因都阻止了AI­GC或通用智能扩散至寻常百姓家。

结尾:企业显然不会坐以待毙。他们给出的策略大体分为三块:对外投资以扩充数据训练场景、夯实客户关系以获取现金流、堆人堆设备砸钱砸出大模型。

以上基本盘是投资机构给出的巨额投资。

“这好比把高科技做成了劳动密集型企业”,一个业内人士哂笑。不过,在当下的时间点,这是没办法的办法。技术上,只要机器足够、标注正确,哪怕是“堆”,也可达到预期目的。

钱的方面,高科技企业已下定决心“内卷”数字经济同行,有销售人员将其称之为“关系是第一生产力”。不过这种思路面临一个问题,就是大模型和通用智能的认知度要高。

“我们拜访了很多客户,但很多人其实根本不理解大模型”,一位业内人士对数科星球(ID:di­g­i­t­al-pl­a­n­et)表述。在他的眼里,传统数字经济在新技术面前有巨大的提升空间。

举例来说,比如政务大屏。

“之前为调取一个地方数据,大屏只能靠下拉、下拉、再下拉的方式调用,而现在对语音助手说‘我要今年的生产情况’,就能自动生成”,这位业内人士解答,在他眼里,东西是好东西,但在买家面前变成了另外一个景色:“如果一个领导想做,他只需要1个理由去做,如果他不想做,他会找出100个理由不做”。

AI­GC热潮高企,但一线销售人员往往会频频碰灰。在高科技浪潮风起云涌的当下,很多人承担着不能言说的苦衷。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/67151.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

擎创动态 | 来自华为的深度认可,擎创再获华为鲲鹏技术认证

在数字中国的信息技术应用国产化进程中,擎创科技除持续投入自主产品研发外,还深度适配了涵盖芯片、服务器、操作系统、数据库、中间件、云服务、应用等领域的国产化产品,与华为的合作适配便是其中重要的一环。近期,擎创夏洛克智能…

Python请求错误“ check_hostname requires server_hostname”?

进行request请求时,有时必须开VPN才能访问,而开着会遇到如下问题: 原因是urllib3升级后增加了 HTTPS的支持,就尝试用https连接代理服务器,但是代理服务器其实只支持 http,因此出现了错误。 简单解决办法&…

flask部署钉钉机器人和企业微信机器人

引言 创建机器人,目的是通过机器人的方式,提出用户的问题,得到想要的回答 钉钉机器人 首先我们需要获取钉钉的企业内部开发者权限然后我们进入钉钉开放平台,登陆后,选择应用开发->机器人->创建应用,我创建了一…

视觉大模型调研(Survey of Visual Foundation Model)

目录 A.写在前面 B.论文支撑与基础理论 1.大模型基本概念的诞生 2.大模型产业化落地的理论支撑 3.视觉模型架构的形成-Transformer到ViT再到MAE C.产业落地化现状 1.百度文心 UFO 2.0 整体概述 原理介绍 模型效果 应用场景与方案 2.华为 盘古CV视觉大模型 模型预训…

30亿参数,华为云发布全球最大预训练模型,开启工业化AI开发新模式

本文分享自华为云社区《HDC.Cloud 2021 | 华为云发布全球最大预训练模型,开启工业化AI开发新模式》,原文作者:技术火炬手 。 4月25日,华为云发布盘古系列超大规模预训练模型,包括30亿参数的全球最大视觉(C…

AI大模型未来将走向何方?广泛应用成首要挑战

导读:如何让AI大模型被广泛应用起来? 目前在AI行业,大模型火到破圈。 今年11月初,华为云盘古大模型的机场广告在首都机场和深圳宝安机场亮相,主打“行业AI开发应用优选”的定位。11月18日,权威时政媒体中国…

千亿参数的盘古大模型

盘古系列AI大模型包括NLP大模型、CV大模型、多模态大模型、和科学计算大模型。具备超大神经网络,实际参数量超千亿;具备强大网络架构,实际综合性能比定制化模型提升10%;具备优秀泛化能力,全场景覆盖率提升10倍。 传统…

华为高级研究员谢凌曦:下一代AI将走向何方?盘古大模型探路之旅

摘要:为了更深入理解千亿参数的盘古大模型,华为云社区采访到了华为云EI盘古团队高级研究员谢凌曦。谢博士以非常通俗的方式为我们娓娓道来了盘古大模型研发的“前世今生”,以及它背后的艰难往事。 本文分享自华为云社区《华为高级研究员谢凌曦…

华为盘古大模型:能源领域的颠覆性突破

近日,华为盘古大模型在能源领域横空出世,引发了广泛关注和期待。作为一项具有颠覆性影响的技术创新,华为盘古大模型在能源行业中展现出巨大的潜力和前景。其优质的计算能力和智能优化算法,将为能源产业带来翻天覆地的变革。 盘古大…

【NLP】华为推出了全球最大的中文语言模型-盘古

作者:金雪锋链接:https://www.zhihu.com/question/456443707/answer/1856014437 这次HDC大会,华为联合鹏城发布了两个千亿的NLP大模型(其中一个模型还和循环智能进行了合作),都是盘古命名的。 一个是4月25日…

快来试试!免费用上GPT-4 !!!

GPT-4 简介 GPT-4是OpenAI上个月推出的最新人工智能语言模型,它可以根据给定的文本或关键词生成各种类似于人类语言甚至超越人类语言的文本,例如文章、故事、诗歌、代码、对话等。 GPT-4拥有1750亿个参数,是目前最大的语言模型之一&#xf…

想找一些外文文献,有哪些靠谱的外文文献网站推荐?

论文写作是目前几乎每个专科生、本科生、研究生的必修课,保证毕业的同时也能够进行一定科研工作。论文写作是基于一定科研试验或社会调查的,但过程中文献检索能力同样不可或缺,能否真正的搞好科研,关键在于能否读懂前人的研究。对…

Get Offer —— 简历投递与加分细节

点赞后看,养成习惯 喜欢的话 可以点个关注哟 你们的点赞支持对博主们来说很重要哦 !!! 本篇文章帮你逐个击破以下几个问题: 01 靠谱的简历投递方式有哪些? 02 接到对方的电话面试通知,你在忙该怎么办? 03 面试时,一开始你不知道说些什么,该怎么办? 04 手忙脚乱…

金九银十,从简历投递到offer审批,入职腾讯我只用了七天

9月底投岗腾讯后台开发,历经3面技术HR面offer审批,我却只花了7天时间就上岸成功了... 文末分享一些我的经验之谈,敬请期待... 9-22 投递简历 9-24 一面(大概1h50min) osi七层网络模型,五层网络模型&#…

我是如何 2 个月拿到 4 份 Offer 并收入翻倍的?

作者 | minus 责编 | 伍杏玲 本文经授权转载自石杉的架构笔记 先做个自我介绍,楼主坐标帝都,5年经验,跳槽之前在一家传统小公司,年薪21万。 这次面试前前后后大概两个月的时间,面试了大概6家公司,命中4…

offer(第二版)2021-06-02

还差差14个题完结 面试题1:赋值运算符函数 面试题2:实现Singleton模式 面试题3:数组中重复的数字 面试题4:二维数组中的查找 面试题5:替换空格 面试题6:从尾到头打印链表 面试题7:重建二…

一文带你玩转offer-01

文章目录 1.RabbitMq是如何实现消息路由的1.1 工作流程1.2 路由策略Direct ExchangeTopic ExchangeFanout Exchange 2.谈谈你对时间轮的理解2.1 什么是时间轮2.2 时间轮的工作原理2.3 时间轮优缺点分析 3.什么是幂等?如何解决幂等性问题3.1 什么是幂等3.2 如何解决幂…

和HR谈了5min包裹,刚拿到的offer又被撤回了...

最近,在网上看到很多人都分享了自己谈薪失败,导致offer被revoke的情况。 撤回就算了,更惨的是,还有可能会被该公司列入黑名单。 Offer被revoke很常见,不过在求一个面试机会都难的今年,到手的offer被撤就显得…

您有一份OFFER请查收!

我们总以为生活欠我们一个“满意” 其实我们欠生活一次“尝试” 爱可生正在招人 快来投简历尝试下吧!🤔 如果你 想看到 金融银行体系对数据高可用性要求达99.9999%, 严格要求数据一致性的场景下 数据库如何选型、如何运维?…

记一次腾讯社招前端面试(已拿到offer入职)

作者:小冷^_^ 链接:https://juejin.im/post/5dde65496fb9a07161483fc9 笔者信息 我某211非计算机相关专业2018届本科生,在校期间实习有半年多的小公司Java开发实习经历,毕业之后投递360,入职了360企业安全成为专门的前…