贾浩楠 发自 凹非寺
量子位 | 公众号 QbitAI
上海车展,60多家主机厂(子品牌合并计算)正在集中秀智能秀新车。
汽车产业憋3年,这是一次空前释放。
谁技术最好?谁能代表智能化未来?还真不好说。
但有30多家车企,却不约而同“商量”了一下:
商汤绝影,车展上诸多热门车型上都有它的身影,或智驾或智舱。而商汤绝影自己的展台,还展现出了平台型AI公司给智能车带来的新想象空间。
大模型“商量”、AIGC平台“秒画”融入智舱系统,突破了现在“平板电脑”式的车内交互。
通过AI数字人可唤醒“商量”,而它则会根据用户属性、应用场景,身兼多职。比如行车过程中收到邮件时,商量化身“邮件助手”,自动提炼关键信息、回复邮件:
它还是位聪明的“会议助理”,可以自动生成会议纪要,大大节省用户行车时处理工作的时间和精力。
“商汤秒画SenseMirage”文生图创作平台还会根据乘客的属性和喜好,生成各类风格的图像:
大模型上车所带来的全新场景体验,让车圈谈论数年的“第三生活空间“概念似乎已近在眼前。
官宣不过1年多时间,绝影展现出的智能汽车技术量产落地的情况是:合作主机厂30多家、超50个生态合作伙伴,定点3100万辆,而且覆盖智驾智舱两个领域。
这也让商汤绝影成了车展上最不显山不露水的赢家之一。
而回溯商汤的历史,这样的剧本似乎早就写好了——ChatGPT带火的AI大模型能力,是商汤从2019年就开始就投入探索建设的。
“绝影”出没车展
绝影,三国曹操的坐骑,与赤兔、的卢一样青史留名的千里马。这届车展上,这匹“绝影”频繁出没于各大主机厂的展台。
广汽埃安旗下主打实用性的中型SUV LX Plus,搭载具备高速领航辅助能力的ADAS系统,背后的支持,是商汤绝影的环视BEV感知能力和通用目标感知能力。
而商汤绝影的全栈智能驾驶能力,搭载在了新势力哪吒的轿跑新车S上,将为消费者带来安全可靠、高效舒适的高速领航辅助驾驶体验。
至于商汤绝影的智能座舱技术,量产落地范围就更广了。
比如蔚来NT2.0平台的ET7/ET5/ES7等等,支持出行场景下对驾驶员的疲劳状态进行实时提醒,同时助力提供Face ID、儿童遗忘检测系统(CPD -Child Presence Detection)等乘员感知技术。
前段时间亮相的极氪两厢纯电小钢炮X,首次采用了完全无门把手的设计,而是在B柱上集成了包括FaceID在内的感应交互功能,同样是由商汤绝影提供。
长安逸达还搭载了绝影健康检测产品,可在不到半分钟内检测出车舱乘员的多种健康指标,带来车载健康管理新体验。
在本届车展亮相的东风猛士917、广汽传祺E9、影酷以及M8宗师、高合HiPhi等车型,也都用了商汤绝影驾驶员感知和乘员感知的多项功能。
总结一下,今年全球汽车行业首个A级车展上,60多个主机厂卷的主题依然是智能化,而这其中,有30多家已经和商汤绝影达成合作,定点3100万辆。
“绝影”确如其名,展现的同样是千里马蹑影追风的速度。
绝影展现出了怎样的技术能力?
商汤绝影在量产车方向,提供的主要是智舱和智驾两个产品。
智能车舱SenseAuto Cabin由驾驶员感知系统(DMS)、车舱感知系统(OMS)、智能进入系统及车舱APP等产品组成。
最基本的功能如“刷脸开车门”。DMS能够根据驾驶员身份同步完成座椅、后视镜等调节。驾驶过程中,还可以对驾驶员行车状态,对疲劳、分心及危险行为进行预警,并且根据驾驶员注视区域及视线方向,提供安全的无接触式交互。
甚至还有更加个性化的功能设置。比如可以根据乘客需要,提供基于年龄、性别等属性的多种定制化服务。
智能驾驶SenseAuto Pilot则是行泊一体的方案,充分共享行车传感器与泊车传感器的感知数据,统一行车域与泊车域的软件架构以及在计算平台的部署,降低软硬件成本,同时提升芯片算力的利用效率,推进智能驾驶全场景打通和落地应用。
在高速场景下,可支持智能导航变道、灵活效率变道等L2+功能,同时可以支持大曲率匝道通行、异性车辆识别与响应,进一步提高功能体验。在城市领航下,绝影通过丰富的感知元素识别能力和识别精度,可以支持路口红绿灯启停、无保护左转、拥堵场景跟车等功能。
商汤绝影记忆泊车产品支持跨层停车场的路径记忆、路径循迹、 智能避让以及目标车位泊入功能,可实现大型多层停车场的跨层路线记忆。
针对高性价比车型,商汤绝影还推出SenseAuto Pilot Entry(6V1R)方案,行车功能可以有效复用泊车的鱼眼相机,最大程度共用传感器,压缩计算资源,实现主动安全、L2 驾驶辅助与 APA 泊车辅助功能。
所以,能看出商汤绝影无论座舱还是智驾,提供区别于其他供应商的独特功能,以及在同等体验下实现成本控制的基础,都是通用视觉识别能力——商汤一贯的强项和核心优势。
实际上感知技术被称为智能车业务的先手环节。
无论是交通、医疗、金融等等行业的AI落地应用,几乎无一例外要求极佳视觉感知能力,以及决策能力,这两项为商汤建设的通用AI能力核心。
从2019年开始,商汤从10亿参数的视觉模型研发,到今天有320亿全球最大规模的通用视觉的模型,实现了高性能的目标检测、图像分割和多物体识别算法,并在自动驾驶、工业质检、医疗影像等多个领域得到广泛应用。
决策方面,商汤联合上海人工智能实验室推出了OpenDILab决策AI平台。这其中的DI-drive是一套自动驾驶仿真训练平台,可通过决策AI在仿真器中构建训练和评测场景,让AI在自动驾驶的复杂交互环境中实现更加精准的决策、规划和控制。
绝影将决策 AI 引入到自动驾驶中的规划控制,正逐步改变以往人为规则驱动的开发模式,高效助力在驾乘体验、数据闭环效率的巨大提升。
这些AI大模型的建设,并不是商汤在2017开始布局汽车业务时才开始的,而是贯穿了商汤自创业以来,在各个场景落地使用AI技术的过程。
所以说,商汤绝影的进展,不是单一的车业务输出,而是平台型AI公司在智能车浪潮中底层核心能力的复用和释放。
通用感知技术、AI决策能力,让商汤绝影能在最合适的时间“上新”“交货”,而他们的背后,离不开商汤对AI大装置的长期投入建设。
什么让商汤“绝影”
算法能力来自大模型,而大模型离不开“大装置”的支持。
商汤AI大装置SenseCore是支撑商汤软件平台的通用人工智能基础设施,用了5年时间建设。总共有27000块的GPU芯片卡,可以输出5.0 exaFLOPS的总算力,是亚洲目前最大的智能计算平台之一。
可实现批量的算法模型生产、部署和迭代升级,支持超大参数通用大模型训练。
基于大装置的能力,商汤构建了计算机视觉、自然语言处理、AI内容生成、多模态、决策智能等多个领域的大模型,持续演进能力并广泛支持各种应用。
在智能车产品的研发和迭代中,这样的能力发挥出重要作用。
比如智能驾驶量产方向上,商汤发布的多模态多任务通用大模型“书生(INTERN)2.5”。其拥有30亿参数,是目前全球开源模型中ImageNet准确度最高、规模最大,同时也是物体检测标杆数据集COCO中唯一超过65.0 mAP的模型。
而OpenGVLab通用视觉开源平台通过“书生”大模型实现了4类核心视觉任务的全覆盖,包括10万多标签的智能识别,为商汤绝影提供强大通用感知能力。
通用感知能力的提前布局,让绝影成为业内率先将BEVFormer++的感知算法实现大规模量产落地的玩家。
智能座舱方向,商汤绝影在车展上展示的未来座舱,首次将语言大模型“商汤商量SenseChat”以及AIGC文生图平台“商汤秒画SenseMirage”上车。
类GPT的能力,使得智能座舱的功能、交互方式、体验有了全新的形式,颠覆了一直以来智能座舱=平板电脑的模式。
这也是智能车领域值得关注的最新趋势:全能型AI玩家入场,用大模型大装置能力改变了以往舱驾分离,各自为战的格局。
对大模型能力的前瞻建设,保证了商汤绝影在智舱智驾技术和产品本身层面的竞争力和使用体验。
而商汤在通用AI能力建设、落地过程中沿途点亮的“灯”,又给了商汤绝影业务更大的潜力空间。
怎么说?
智能驾驶覆盖ODD范围不断扩大,使得座舱之内的交互、应用需求也快速增长,“智慧出行空间”的概念,从来没离普通用户这么近过。
自然而然,商汤以往在其他领域落地的AI技术,现在也能开始在智能车这个平台上输出:
智能车本身作为娱乐、健康、交通服务的需求者同时,也是各种感知、视觉数据的生产的源头。
深度挖掘这些数据蕴含的价值,商汤可以以车为核心,以过往业务为节点,连接起一个包含各个行业的生态。
全能型玩家入场,智能车的游戏规则可能很快就会被改写。
— 完 —
点这里👇关注我,记得标星哦~