作为座舱智能化交互的关键角色之一,语音识别及交互一直以来也是不少汽车品牌的主打功能之一。
比如,随意打断语音助手,连续下达指令,融合更多车身控制功能,甚至是ChatGPT大模型的结合,给了消费者更多的想象空间。
而在国内车企深度布局语音技术方面,小鹏汽车毫无疑问是排头兵。这家新势力在早期通过与思必驰合作,并逐步在核心的语义解析、识别增强、语义抗噪、语义打断、自然语言处理等技术领域进行自研。
在小鹏P7的发布会上,小鹏汽车CEO何小鹏曾表示,未来车内最好的交互方式就是语音交互,正是这个原因,公司在语音助手方面布局了自主研发。
然而,在过去几年时间,随着语音技术上车的门槛逐步降低,各家功能体验的差异化也在逐步缩小。同时,多模态交互技术的逐步上车,也在降低车企对于语音方案的采购预算。
高工智能汽车研究院监测数据显示,2022年中国市场(不含进出口)乘用车前装标配语音识别及交互功能渗透率达到了74.33%,其中具备车控功能的占比也已经接近70%。
这意味着,对于第三方供应商来说,继续提升技术性能和交互体验的难度在持续提升;而对于车企来说,语音功能的差异化已经不再是智能化主角。
就在去年3月,原小鹏汽车语音负责人赵恒艺离职小鹏。而作为赵恒艺的前东家(前VP),思必驰也在今年5月宣布冲刺科创板上市失败。
在发审委给出的意见中,重点关注了以下事项:一是发行人(思必驰)核心业务的市场竞争格局、核心产品的差异化竞争布局、核心技术的科技创新体现、核心技术与主要产品的升级迭代周期和研发储备,关注发行人核心技术的硬科技属性、差异化竞争的有效性;
二是发行人预测了 未来四年营业收入复合增长率,审核关注相关预测的合理性和审慎性,发行人报告期内持续亏损、净资产大幅下降的情况, 以及发行人经营能力的可持续性。
作为国内较早布局AI语音赛道的公司,思必驰也是为数不多在汽车行业形成规模化上车能力的初创公司之一。在汽车前装赛道,Cerence、科大讯飞、百度Apollo等一直霸占主力份额。
按照思必驰的招股说明书显示,公司基于自主研发的智能语音语言技术,构建了全链路智能对话系统定制开发中台,具备大规模场景化定制能力,为智能家电、智能汽车、消费电子以及数字政企类客户提供软硬件结合的产品服务。
其中,在汽车领域,除了后装业务,在智能汽车前装赛道,该公司的客户涵盖长城、上汽、北汽、理想、小鹏、上汽通用五菱、哪吒、博泰等国内头部主机厂及Tier1厂商。
今年一季度,该公司还完成了大众汽车、戴姆勒、哪吒汽车等标杆客户的定制化项目,且与比亚迪、理想汽车、长城汽车等客户的多款车型进行合作并实现收入。
按照公开的财务数据显示,思必驰在报告期内(2020-2022年)分别实现营业收入2.37亿元、3.07亿元和4.23亿元。其中,在汽车领域,2022年度来自上汽集团的营收为1,784.22万元,为公司第一大客户。
不过,在盈利能力方面,数据显示,报告期内归属于母公司所有者的净利润分别为-1.80亿元、-2.98亿元和-2.64亿元,尚未实现盈利。
此外,截止今年一季度末,该公司合并口径未分配利润为-6.73 亿元,存在大额未弥补亏损。同时,报告期内主营业务毛利率分别为69.74%、58.15%和57.91%,毛利率呈下滑趋势。
对此,思必驰的解释是:人工智能行业为技术密集型行业,产品升级迭代速度较快,需要维持大量的资金投入,研发费用较高,资金压力较大。
另一家正处于IPO上市进程的AI语音公司,是出门问问。这家公司曾与大众集团有一家合资公司(已清退股权),主攻车载语音方案。目前,出门问问仍在为大众集团提供语音底层技术的专利授权。
数据显示,出门问问在2022年来自大众集团的收入为2.13亿元,占到公司年度总收入的42.6%。而该公司2021-2022年分别亏损2.76亿元、6.70亿元。
而在高工智能汽车研究院看来,这已经是行业的常态。
以科大讯飞为例,作为国内头部车载语音方案提供商,2022年实现业务收入4.65亿元,同比仅增长3.56%。按照2022年度710万套的前装出货量,单价仅为60元左右。
同时,在科大讯飞年度占公司营业收入或营业利润10%以上的行业、产品中,并没有出现汽车智能网联相关业务。(按照该公司2022年2.96亿元营业利润测算,汽车业务毛利率低于6%。)
此外,作为全球市场汽车语音方案的头部供应商,Cerence今年一季度的营收更是同比下降20.74%(GAAP,下同),运营利润率更是降至负数(-30.1%),而上年同期为7.3%,季度净利亏损约2600万美元。
在过去几年时间,前装车载语音市场遭遇「天花板」效应,尤其是前装搭载率的上升空间受限,产品价格持续下滑,给这个细分市场带来了巨大的负面影响。
从行业演进来看,1.0阶段,车载语音主要实现基础的识别功能,比如,电话、导航的单项控制;2.0阶段,则增加了车控部分,包括空调、天窗的控制等更多元化的功能,同时,语音交互能力开始升级,并融合了车端和云端互联服务。
高工智能汽车研究院监测数据显示,以2020年为界限,中国市场此前主要是1.0语音能力的上车,随后进入2.0阶段的高速成长期,同时,部分车企开始进入3.0能力的构建。在这个过程,单一语音模块的价格也从早期的上百元迅速下滑到几十元,并且价格压力还在持续。
而进入3.0阶段,车载语音功能更多强调的是个人智能助理的角色,以人机对话交互为核心,融合智能导航、多媒体娱乐、车身控制等智能座舱人机交互需求,更多涉及语言模型定制、个性化语音合成、对话逻辑定制等。同时,开始进入舱内多模态交互的系统构建阶段。
这个阶段,更加强调车企的整合和自研能力。
比如,理想汽车选择自研理想同学引擎,其中,底层能力来自地平线+思必驰+微软三家供应商的技术融合。此外,基于地平线提供的声源定位、盲源分离和降噪算法,从而实现针对语音交互的痛点来实现优化升级。
这意味着,过去一家供应商的方案预算(尤其是传统汽车制造商),正在被车企不断分解为模块化软件采购,在整体市场蛋糕已经见顶的背景下,供应商在增收承压的同时,还面临白热化竞争,以及持续的技术投入周期。
此前,科大讯飞公告称,目前正在基于星火大模型提升(包括智能汽车业务)现有产品竞争力,公司研发投入的一半以上都与星火大模型强相关。今年下半年公司会all in大模型,并寻求构建自我造血能力。
数据显示,科大讯飞预计,今年上半年归属于上市公司股东的净利润同比下滑71% -80%,扣非净利润为亏损2.7-3.3亿元,而上年同期为盈利2.79亿元。