重新定义座舱智能化的下半场?谁能抓住弯道超车的窗口期

2020年,高通8155上车之前,行业的定义更多是4G联网+互联网生态(智能手机的复刻),以斑马智行为代表;而随着集成异构计算、高性能AI引擎(8TOPS算力)的高通8155密集上车,驱动行业在过去两年时间进入硬件升级周期。

接下来,还有下一代高通8295高达30TOPS的AI算力,以及更多高性能SoC、独立高性能GPU供应商也在进入汽车赛道,这为座舱智能化带来了足够的硬件能力支持和功能体验升级的新动力。

与此同时,传统数字座舱以硬件为主的供应链体系,也在智能化的驱动下,逐步进入软件定义座舱的新周期。「通用人工智能带来创新范式变革,重新定义生产力,带来更多元化应用。」在商汤看来,智能化体验正在成为影响汽车品牌、定价、消费者认知的核心因素之一。

高工智能汽车研究院监测数据显示,2022年中国市场(不含进出口)乘用车搭载智能数字座舱(大屏+语音+车联网+OTA)前装标配交付795.05万辆,同比增长40.59%,前装搭载率为39.89%。

而在高阶智能座舱方面,2022年座舱域控制器搭载量交付172.65万台,前装搭载率达到8.66%,占智能数字座舱交付量的21.72%。此外,5G前装标配交付41.74万辆(不含选装),前装搭载率为2.09%。「大算力和高速联网,作为基础设施,将驱动座舱智能化实现质的升级」。

在商汤绝影智能车舱副总裁许亮看来,“智能座舱领域是汽车智能化赛道增速最快、最大的机会点之一。从全球范围看,当前也是本土供应商实现弯道超车的窗口期。”安全、娱乐、办公以及场景驱动也被视为核心的细分需求,也是智能座舱下半场的主战场。

一、从视觉交互开始

事实上,和智能驾驶一样,安全也是智能座舱的第一要素。而在安全基础上,智能座舱还承担着更关键的作用:如何建立车企和车主之间的纽带,提升交互体验并形成用户黏性。

这其中,基于摄像头的Face ID技术,并逐步延伸到DMS、OMS可以说是过去几年座舱人机交互的最大变革之一,同时也是AI+安全+体验升级的典型代表之一,并处于高速增长周期。

高工智能汽车研究院监测数据显示,2022年中国市场(不含进出口)乘用车前装标配Face ID功能交付114.86万辆,同比增长92.49%,搭载率为5.76%;前装标配DMS(基于摄像头)搭载交付118.64万辆,同比增长109.20%;OMS前装标配搭载交付69.65万辆,同比增长93.69%。

Face ID技术可以帮助用户快速登陆个人车机账号,实现各类个性化功能和配置。但同时,这项技术的背后,还有很多安全的特性。「众所周知,AI创新,最早是在安防、金融以及手机支付等领域率先规模化落地,典型的高频应用就是Face ID。」在商汤看来,公司此前在非汽车行业的平台化应用已经打下了坚实基础。

这其中,既涉及到个人身份认证,也涉及到类似人脸识别开门(区别于蓝牙、NFC、UWB等数字钥匙技术)等高安全等级的应用。在许亮看来,这本身就是很多车企的安全痛点。「尤其像银行、支付相关的人脸识别应用,对安全性要求特别高。」

DMS,是Face ID之后的又一个焦点。

作为驾驶员疲劳、分心检测的关键技术,DMS从早期的预警角色逐步过渡到协助提升人机共驾的体验和安全。「目前,很多车企都希望能够尽快的把智能驾驶和智能座舱的信号打通,同时提高DMS算法的鲁棒性和可靠性,来帮助更好的去提升L3甚至更高阶自动驾驶的体验。」许亮强调。

这意味着,对于传统仅仅从事DMS技术研发的公司来说,增加了更高的难度。而商汤是目前全球为数不多同时具备智能驾驶和DMS底层算法原创技术能力的供应商之一。

商汤绝影商务副总裁杨琳举例称,比如在蔚来ES7的量产案例中,基于面部视觉AI检测技术优势,商汤的增强模型对细粒度特征的捕捉能力,并持续完善corner case的数据量,实现目标物复杂场景的精准感知。

其中,针对驾驶员注意力检测升级为3D空间建模方案,应对不同驾驶员身高、坐姿习惯及环境光照等干扰,长尾场景下播报准确率提升53%;此外,基于EYE模型的优化训练,针对小眼睛用户、睁闭眼及逆光等复杂场景下播报准确率提升47%。

这些都得益于2021年商汤科技推出的“SenseAuto绝影”智能汽车平台,以SenseCore商汤Al大装置为基石,以SenseAuto Empower绝影赋能引擎为底座,通过SenseAuto Cabin绝影智能车舱、SenseAuto ADAS绝影量产智能驾驶、SenseAuto V2X绝影车路协同三大业务板块构成全栈体系,全面赋能国内外车企客户的智能化升级战略。

商汤绝影基于在感知、决策规控和AI云三大核心能力,打造了驾、舱、云三位一体的产品体系;比如,早于2017年,商汤就与本田建立长期战略合作,成为亚洲首个与全球前五大车企品牌合作开发自动驾驶技术的AI企业。

根据高工智能汽车研究院监测数据显示,2023年1-3月中国市场(不含进出口)乘用车前装标配搭载IMS(含Face ID、DMS、OMS等视觉交互类应用)交付38.21万辆,渗透率为9.32%。其中,商汤绝影在IMS(不含芯片自带算法、车企自研)算法前装市场份额为17.03%,继续领跑。

而更多的创新应用,也在不断赋能车企。

比如,绝影智能车舱推出了「智能救援」产品,通过驾驶员的身体姿态、生理指标以及车辆信号等多维度信息对驾驶员健康状况进行判断,如出现极端情况,车辆会停在路边,并紧急呼叫联系实施救援,及时挽救车内人的生命。

二、多模态交互的新周期

而从安全到体验,杨琳表示,「一些车厂会比较在意供应商的产品多样性组合,都倾向于能够给车主有更多的不同体验产品可以供选择;同时,不同的品牌、车型,和对应的用户群,画像都不一样。」

平台能力+产品多样性,被商汤视为在智能座舱赛道的核心竞争力。

比如,2022年,在智能手机和智能终端领域,搭载商汤AI SDK的新增量产智能手机达4.5亿台,超分和人像系列功能取得市场份额第一。这意味着,相比于仅仅为汽车行业提供AI解决方案的友商相比,商汤可以帮助车企共创更多创新应用。

从无感进入、儿童感知、健康检测、智能相册、虚拟伴侣、AR小巴、管柱摄像头移动自标定……到本次车展全新发布的唇语唇动识别、哨兵模式、智能救援、隔空手势(Air Touch)、AR K歌、智能屏保等6款创新产,这是商汤在过去几年加速横向创新、融合创新的结果。

而视觉多元化应用只是第一步。

比如,以传统语音和触摸交互为主,人脸识别、手势识别、声纹识别等为辅,实现多维度智能座舱操控,再融合360°环视及驾驶员监控等等安全辅助功能,接下来,延伸的功能还有涉及驾驶员和乘客的生命体征、情绪感知监测。

其中,商汤绝影首创的基于纯视觉的“唇语唇动”识别功能,利用多模融合算法,让用户通过唇语即可发出超过40个命令词和唤醒词进行多种车内交互,避免人声干扰、播放音乐、高速风噪、高速胎噪等场景下语音交互的误触发。

“隔空手势”则可让用户通过各种手势,隔空完成点击确认、拖曳等各类屏幕操作,且能做到鼠标级别的精准操控和实时响应,为人机交互带来更多便捷。

背后的驱动因素,一方面是座舱体验的升级;另一方面,则是在L4级自动驾驶真正量产之前,如何适应「人机共驾」(驾驶员与智能驾驶系统以一种持续协同合作的方式共同控制车辆,完成驾驶任务)场景下的交互需求。

「过去几年,座舱人机交互还处于单一功能上车周期,无论是大屏显示交互、语音、DMS、 AR/VR等,」在高工智能汽车研究院看来,随着车企对于差异化要求越来越高,如何进一步提升单一功能的体验,并且进行深度融合,成为下一个阶段的重点。

以语音为例,高工智能汽车研究院监测数据显示,2022年中国市场(不含进出口)乘用车前装标配车载语音识别及交互功能交付1478.98万辆,同比仅增长4.58%,前装搭载率已经超过70%。

「大家都知道,传统座舱语音系统的自然语言理解,差不多有十几年的技术沉淀。但交互仍然更多停留在机械指令式的互动,没有办法做到更多的深度互动。」在许亮看来,包括基于LBS的服务在内,目前正处于关键的变革性机会周期。

尤其是,随着ChatGPT的出现,通用人工智能(AGI)引领了二次革命,以更加高效的方式解决海量开放式的任务,更加接近人类的智能,而且可以产生新的智慧,也带来了新的研究范式。

比如,传统语音交互的深度学习,可以做到输入是多模态的数据,输出也可以是多个任务,但是这些任务都是预先设计好的。如果我们遇到新的任务,就要重新设计AI系统,采集样本,对模型重新训练。

此外,即便是行业正在攻坚的全时对话、全车多人对话、多轮对话等能力,本质上仍然是解决语音识别的问题。快速而准确地完成操作指令,以及毫秒级响应,“说到即做到”仍是主角。

而一个AGI模型,给定合适的提示词作为输入,可以生成多模态数据,加上用自然语言描述的任务。我们无需改变模型本身,通过设计合适的提示词就能覆盖海量复杂的开放式的任务,包括各种长尾任务以及一些主观描述性的任务。

「通用人工智能模型可以通过与人的互动,产生有智慧的内容,我们叫做人机共智。」杨琳表示,商汤的判断是,基于超级算力+超大模型的商汤AI大装置,可以为智能汽车构建通用智能的能力。

实际上,从2019年开始,商汤从10亿参数的视觉模型研发,实现到今天有320亿全球最大规模的通用视觉的模型。在NLP领域,商汤也有接近2000亿参数的大模型,包括有能力去训练1800亿参数的多模态模型。「未来通用人工智能基于多模态的大模型,可以做视觉的感知,语言的理解、内容的生成和决策的推理。 」

今年4月,商汤也正式对外发布“日日新SenseNova”大模型体系,同时提供了开放的API,包括图片生成的API,自然语言生成的API,视觉通用感知任务和标注的API,开放给客户和合作伙伴。

本次上海车展,绝影展台上商量、秒画“上车”,与商汤大模型体系深度融合的绝影未来展示舱升级亮相,重构未来车舱体验,打造真正的智能化“第三生活空间”。

这意味着,传统座舱语音交互的功能,将进入一个全新的时代。「自然语言生成的服务支持通用对话功能,具有极强的中文多轮对话能力和超常文本的理解能力,而且能够不断自我更新的学习和进化。」

此前,有消息称,特斯拉正在考虑与OpenAI(也是马斯克的早期投资项目之一)合作开发ChatGPT,为特斯拉车主提供更加智能化的语音交互服务。

三、从量变到质变

所有上述能力的基石,是商汤绝影基于SenseCore商汤AI大装置强劲支撑,打造绝影核心能力。通过超级算力和超大模型,SenseCore商汤AI大装置可为智能汽车构建通用智能的能力,推动智能汽车与各个产业相互融合。

而对于一家仅仅专注于汽车行业的供应商来说,显然很难实现投入与产出的平衡。而基于AI大装置,将为商汤带来AI模型的大规模量产和商汤研发效率提升。

「我们的跨场景智慧产业生态布局,源源不断地将商汤在多个不同行业积累的丰富实践经验、成熟的产品和解决方案引入到商汤绝影智能汽车平台。」在许亮看来,这是打破智能汽车创新边界的关键所在。

目前,商汤科技拥有研发人员超过4000人,其中拥有博士及博士候选人超过250人,教授40位,并与全球52所顶级院校合作,在全球建立了15个联合实验室。

比如,在智能座舱业务线,通过商汤积累深厚的视线追踪、头部姿态、动作识别、物体识别技术,借助完善的产业链,提供全方面、多层次的智能车舱 AI 整体产品方案,为汽车智能化、数字化提供技术支撑。

这些功能的落地,也得益于商汤的跨领域技术积累。

比如,商汤SenseCore AI大装置持续扩建,完成2.7万块GPU的部署并实现了5.0 exaFLOPS的算力输出能力,以AI-as-a Service (AIaaS)的模式面向行业伙伴提供服务。目前可最多支持20个千亿参数量大模型(以千卡并行)同时训练,最高可支持万亿参数超大模型的训练。

截至目前,商汤绝影已与30多家车企合作,拥有超50个生态合作伙伴,商汤绝影智能驾驶和智能座舱产品累计前装定点数量超3100万台。2022年,绝影智能驾驶和智能车舱产品完成了27款车型的适配和量产交付,新增汽车定点数估计超过800万台,覆盖30多家车企的80多款车型。

其中,在2023上海车展上,有近30款搭载绝影产品的合作车型展出。比如,蔚来ES7支持出行场景下对驾驶员的疲劳状态进行实时提醒,同时助力提供Face ID、儿童遗忘检测系统(CPD -Child Presence Detection)等乘员感知技术。这些功能也同样应用于基于蔚来NT2.0平台的ET7、ET5等车型,未来还将延伸至蔚来更多核心车型中。

此外,商汤绝影还为本次车展的重磅新车极氪X行业首个智能B柱交互系统提供软件的解决方案,让用户可以无感进入,轻松解锁和落锁车辆。同时亮相的东风猛士917,广汽传祺E9、影酷以及M8宗师等车型也会搭载商汤绝影驾驶员感知和乘员感知的多项功能。

作为中国本土高端智能电动品牌,高合HiPhi也与绝影智能车舱的多项先进功能进行了合作,将智能温馨的驾乘体验带给驾驶员和乘客。而上市即热销的长安逸达亦搭载了绝影健康检测产品,可在不到半分钟内检测出车舱乘员的多种健康指标,带来车载健康管理新体验。

在高工智能汽车研究院看来,对跨场景的深刻理解和技术创新,再加上规模化的量产经验,将是接下来智能座舱市场竞争的新指标。「提升用户体验」,必须是建立在「量」的基础上,实现「质」的突破。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/26477.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

一场内容生产的革命 :从PGC、UGC到AIGC

1 概念解读 1.1 什么是PGC? PGC 是指专业生成内容(Professional Generated Content),是由专业的内容创作者或团队进行创作、编辑和发布的内容。PGC创作方式起源于传统媒体时代,如报纸、杂志、电视和电影等&#xff0…

ruby on rails_将社交登录集成到Ruby on Rails应用程序中

ruby on rails I remember the old days when people had to register for an account separately on each website. 我记得以前人们不得不在每个网站上分别注册一个帐户的日子。 It was a boring and tedious process to repetitively enter the same information over and o…

效率!我用 ChatGPT 干的 18 件事!

来源:https://blog.csdn.net/weixin_42475060/article/details/129399125 给大家整理了 18 种 ChatGPT 的用法,看看有哪些方法是你能得上的。 语法更正文本翻译语言转换代码解释修复代码错误作为百科全书信息提取好友聊天创意生成器采访问题论文大纲故事…

国外一些知名的网盟、返利网平台,赚钱的底层逻辑是怎么样的?

今天的这篇文章,想和大家聊一聊项目的可持续性。随着互联网的发展以及今年chatGPT的横空出世,其实大家会发现一个问题,那就是各种项目层出不穷,很多项目的生命周期很短。 而且最近网上有个段子:“某个知识博主说&#…

chatgpt赋能python:Python图片保存方法

Python图片保存方法 Python是一种高级编程语言,广泛用于数据分析、科学计算和Web开发等领域。其中,图片处理是Python的一个重要应用方向之一。本文将介绍如何使用Python来保存图片。 保存本地图片 保存本地图片是Python处理图片的一个重要操作。Pytho…

你好 ChatGPT, 帮我看下这段代码有什么问题?

点赞再看,动力无限。 微信搜「 程序猿阿朗 」。 本文 Github.com/niumoo/JavaNotes 和 未读代码博客 已经收录,有很多系列文章。 今天一个很简单的功能,触发了一个 BUG,处理后我想起了最近爆火的 ChatGPT,于是我尝试测…

Mac更改桌面名称

前后对比 Mac桌面可以很方便的将我们繁多的任务进行分类,通过创建多个桌面将不同的应用聚焦。但是MacOS创建的桌面默认的只能是下面这种样式: 而作为DIY爱好者,想要修改成下面的样式,通过重命名的方式来区分不同的桌面所担任的职…

Mac电脑如何添加多个桌面?Mac多桌面创建使用技巧

电脑桌面上乱七八糟的程序、窗口是否影响你的心情呢?Mac多桌面可以轻松解决这一难题。那么Mac电脑如何添加多个桌面呢?这里小编为大家带来了Mac多桌面创建使用技巧,一起来看看吧! 1.打开Mission Control(调度中心) 系统偏好设置-调…

linux xfce4桌面 仿mac os美化

系统:Xubuntu 18.04 Xubuntu 美化之后的样子 一、安装xfce4的主题和图标 下载主题,图标样式:http://xfce-look.org/ 将下载的主题,移动到桌面主题目录:/usr/share/themes 将下载的图标,移动到图标主题目…

MacBook远程桌面Windows使用Microsoft Remote Desktop for Mac_亲测使用

MacBook远程桌面Windows使用Microsoft Remote Desktop for Mac_亲测使用 像Windows上有自带的远程桌面连接软件.MacBook没有自带的远程连接Windows桌面的工具,需要安装软件来实现. 像远程桌面控制软件一般有 TeamViewer、向日葵远程控制, ToDesk, Microsoft Remote Desktop f…

Mac远程连接Windows桌面的软件推荐

有时候我们会需要远程连接其他电脑桌面,实现远程办公、远程帮助他人等目的。Windows电脑之间可以用Windows自带远程桌面,Mac电脑也有自带的远程桌面功能。 那么Windows和Mac之间需要进行远程桌面连接,有没有办法实现?答案是有的。…

硬核桌面美化,让Windows电脑像Mac一样充满高级感!

我们经常需要在电脑桌面放置一些文件,方便日常使用和操作,但是如果不好好整理的话,时间一久桌面就会变得很乱,既不美观,也不好找,特别是每天一开机对着一桌面的文件,这滋味简直无比难受。 可是…

mac电脑如何快速显示桌面及切换应用

使用mac电脑时,我们习惯打开很多应用,文档等等。如果打开应用非常多,需要操作桌面,却不知如何快速返回桌面和切换应用时,操作就非常不便了,下面简单介绍mac电脑系统如何快速显示桌面及切换应用?…

mac远程桌面Microsoft Remote Desktop for Mac - Mac-连接Windows远程桌面

好记星不如烂笔头,这里记录平时工作中用到的东西,不喜可以留言。 1:在mac电脑远程桌面可以使用,Microsoft 远程桌面 使用 Microsoft Remote Desktop 这个还是很老的版本; Microsoft Remote Desktop 10 已经在 Mac…

计算机辅助翻译与笔译的关系,机器翻译 vs 计算机辅助翻译:有什么区别?

“计算机辅助翻译”和“机器翻译”听起来很相似,很容易混淆。但两者之间存在着显著的差异,会导致截然不同的结果。 机器翻译:快捷便宜,但不准确 机器翻译是将文本输入计算机,通过计算机算法将文本自动翻译成另一种语言来完成的。也…

catti 三笔 计算机专业,catti三级笔译含金量高吗

catti三级笔译含金量是很高的,它是一项在全国实行的、统一的、面向全社会的翻译专业资格认证考试,是对参考人员口译或笔译方面双语互译能力与水平的评价与认定。 CATTI三级笔译翻译难度如何 1、CATTI考试分综合能力和笔译实务,要两个都过60分…

干货!学习笔译需要坚持的几件事

干货!学习笔译需要坚持的几件事 对于每个学习笔译的小伙伴来说,或许都经历过这样的迷茫: 辛苦练习没效果? 翻译理论一脸懵? 翻译技巧无头绪? 2020CATTI的考试时间已经尘埃落定,上下半年的两…

笔译现在用计算机考试了吗,做笔译需要计算机技术很强吗

bochuangshua 新兵答主 05-29 TA获得超过969个赞 我是做笔译的,本科毕业于安徽师范大学计算机教育专业(2019年毕业),说两句吧 笔译说白了就是将一种语言转化为另一种语言的信息处理的过程,这个过程中可能遇到各种陌生行业(财经、冶金、IT、医…

Latex常用数学符号输入方法

原文地址: Latex常用数学符号输入方法 问题1:字母上面的上标输入方法 问题2:小写希腊字母的输入方法 问题3:大写希腊字母的输入方法 问题4:二元关系符的表达方式 问题5:二元运算符的表达方式 问题6&#xf…

Latex数学符号对应表

Latex数学符号对应表 - 叮叮当当sunny - 博客园 目录 1. 希腊字母2. 运算符符号3. 关系符号4. 箭头符号5. 括号符号6. 其他符号7. MATLAB 回到顶部 1. 希腊字母 字母实现字母实现αα\alphaAA\Alphaββ\betaBB\Betaγγ\gammaΓΓ\Gammaδδ\deltaΔΔ\Deltaϵϵ\epsilon…