MANA OASIS加持,毫末算力极致优化,训练成本降低100倍

2023年1月5日,第七届HAOMO AI DAY在北京举办。正值岁末年初,中国自动驾驶届开年盛会精彩来袭。本届AI DAY上,毫末分享了2022年三大战役稳健收官成果,展望2023年全球自动驾驶发展趋势,并发布毫末技术、产品最新成果。

(第七届HAOMO AI DAY在北京举办)

毫末智行智算中心“雪湖·绿洲”(MANA OASIS)重磅发布,这是中国自动驾驶行业最大智算中心,每秒浮点运算达到67亿亿次。有了MANA OASIS的加持,毫末MANA五大模型全新亮相升级,车端感知架构实现跨代升级,毫末的技术栈布局继续保持完整领先的态势,尤其在感知、认知等层面领跑行业,引领大模型、大算力、大数据发展方向,冲刺进入自动驾驶3.0时代。

(毫末智行与火山引擎合作:建成中国自动驾驶行业最大智算中心MANA OASIS)

产品层面,2024年上半年,毫末城市NOH落地将达到100城,这是中国第一个可大规模落地的城市导航辅助驾驶,以重感知、大模型的技术路线及技术应用、用户闭环的数据建设等方向保持领先位置,2025年毫末HPilot全面进入全无人驾驶时代。

毫末智行董事长张凯表示,2023年,毫末将继续把安全、可靠、实用的智能驾驶产品快速、大规模推向市场,赢得广大用户的认可和肯定。

2023十大自动驾驶趋势预测重磅发布,毫末2023年四大战役正式打响

“过去三年是毫末穿越创业生死线的关键期,但三年只是创业漫长旅程的开端。”张凯以《春归有期,AI照亮未来》为主题,回顾了毫末2022年发展成果,并公布了2023年发展规划。

(毫末智行董事长张凯进行主题演讲)

  张凯表示“2022毫末三大战役稳健收官。”2022年毫末持续稳居中国量产自动驾驶第一名,三代HPilot产品搭载至魏牌、坦克、欧拉、长城炮等近20款车型,辅助驾驶用户行驶里程突破2500万公里;毫末城市NOH是中国第一个可大规模量产的城市导航辅助驾驶产品,目前软件封版达到交付状态;末端物流自动配送车已初步完成商业闭环,交付超1000台,小魔驼配送订单量突破13万单,商业化进程正全面提速;MANA学习时长超42万小时,虚拟驾龄相当于人类司机5.5万年。此外,毫末自研的AEB算法助力魏牌、欧拉、坦克的四款车型获得E-NCAP(欧洲新车安全评鉴协会)、ANCAP(澳大利亚新车安全评鉴协会)五星安全认证,搭载毫末HPilot的300台摩卡DHT-PHEV车型也已奔赴欧洲。毫末不但是中国首个自研AEB算法落地海内外的公司,也是中国首个出海欧洲、澳洲的自动驾驶公司。


(毫末稳居中国量产自动驾驶第一名)

毫末在乘用车领域产品高速迭代的背后,是毫末打造的业内独有的产品能力迭代铁三角:即场景化用户体验设计、人工智能技术、技术工程化能力。基于此,MANA已形成了强大的数据智能驱动体系,它包含六大闭环:用户需求闭环、研发效能闭环、产品自完善闭环、数据积累闭环、数据价值闭环、业务工程化闭环。

用户需求闭环中,毫末已建立5大维度、264类核心用户需求,日常可以从大量核心场景数据中提取核心问题;研发效能闭环则通过仿真工具提升研发效能。目前毫末仿真在研发中覆盖率超过70%,研发效能较两年前提升8倍;产品自完善闭环,让毫末的产品自完善闭环率超过70%,助力客户成功实现7次OTA在线升级;数据积累闭环中,毫末通过自研自动化数据采集、自动化数据标注工具,在2022年底数据成本降低98%;数据价值闭环,让毫末的全新车型复用开发只需4个月时间即达到量产落地状态,全新车型匹配标定2个月内匹配完成,标定效率全行业第一;业务工程化闭环,让毫末可以做到智驾产品100%一次性过线率,毫末成为国内唯一的智能驾驶技术工程化经验最丰富的公司。

(毫末MANA六大闭环构建领先数据驱动体系)

张凯在现场讲到,毫末数据智能驱动体系的六大闭环能力,助力客户的智能汽车快速规模化量产,真正为用户释放价值,使智能汽车的智能驾驶系统从用户尝鲜阶段过渡到用户依赖阶段。毫末成为中国最早且唯一一个进入产品快速迭代阶段的自动驾驶公司。

“2023年,智能驾驶下半场的竞争将进入加速期,高阶智能驾驶产品商业应用将迎来大规模落地。”基于这一基础判断,张凯从行业、技术、产品、人才等方面对2023年自动驾驶行业发展做出十大预测。

行业层面,2023年自动驾驶将全面进入3.0时代;高级别智能驾驶将成为中端车型标配;全新一代芯片、传感器进入市场,自动驾驶生态呈现更丰富多样性。技术层面,大模型在数据合成、知识提取等方面的能力将助力自动驾驶迭代速度实现量级提升;自动驾驶系统比拼将由功能竞争转变为通勤效率竞争;超算中心会成为自动驾驶企业的入门配置。产品层面,城市导航辅助驾驶进入重感知阶段,大规模量产交付大幕拉开;智能驾驶的用户体验将从尝鲜转变为用户依赖;末端物流自动配送车整体成本降至10万元以内,将进一步改善生产关系。人才领域,张凯判断AI自动驾驶领域激烈的人才竞争将会延续到2023年。

(毫末重磅发布2023自动驾驶行业十大趋势预测)

面对未来所要迎接的趋势和机遇,张凯正式宣布毫末2023年发展规划,毫末打响“2023年四大战役”。最重头的是“智能驾驶装机量王者之战”,毫末将完成多平台、数十款车型、数十个项目的异步并行开发,通过智能驾驶流程化开发和标准化交付,进一步推进未来搭载毫末辅助驾驶产品的乘用车达百万量级的目标;其次是“MANA大模型巅峰之战”,毫末将在智算中心助推下,将大模型的应用落地进行到底;第三场战役是“城市NOH百城大战”,毫末城市NOH将有序落地到国内100个城市,引领城市导航辅助驾驶的大规模量产落地;最后是“末端物流自动配送商业之战”,毫末将继续坚持5S合作服务模式,助力合作伙伴快速实现产品和解决方案落地,加速无人配送行业应用进程。

(张凯宣布毫末正式打响“2023四大战役”)

“毫末始终认为,伟大的机遇要靠内在的实力去把握,在激烈市场竞争中取胜的关键,仍然是掌握核心技术。”演讲中张凯强调了毫末在技术研发投入上的坚定决心。截止目前,毫末已获得专利证书146件,全面覆盖数据融合、智能感知、智能决策、控制执行、模型算力提升等领域。“未来,技术研发仍将是毫末投入的重中之重。”

(张凯表示,技术研发是毫末未来发展重中之重)

中国自动驾驶最大智算中心MANA OASIS成立,毫末五大模型全新亮相升级

第七届HAOMO AI DAY,毫末智行宣布智算中心“雪湖·绿洲”(MANA OASIS)正式成立。MANA OASIS是中国自动驾驶行业最大智算中心,由毫末智行与火山引擎联合打造,每秒浮点运算达67亿亿次,存储带宽每秒2T,通信带宽每秒800G。

(顾维灏表示,MANA OASIS将助力毫末冲刺进入自动驾驶3.0时代)

毫末智行CEO顾维灏表示,“MANA OASIS让毫末拥有了超级计算能力,数据、算力充沛,毫末的技术产品能力将更加强大。在‘MANA OASIS’加持下,毫末将冲刺进入自动驾驶3.0时代。”

火山引擎总裁谭待表示,“我们很荣幸与毫末智行一道在智算中心领域达成深度合作,共同推动自动驾驶智能训练平台跨越式发展,加速自动驾驶技术敏捷迭代和商业化落地。”

(毫末智行智算中心“雪湖·绿洲”每秒浮点运算达67亿亿次)

数据驱动是自动驾驶发展的方向与趋势,海量的产品数据、超大规模的数据训练、大模型的应用等,都对算力提出了更庞大的需求。基于火山引擎丰富的大数据积累和底层技术,MANA OASIS实现的计算、存储、通讯能力,让数据更快速转化成知识,以实现将本增效的目的。

在数据管理能力方面,为充分发挥智算中心价值,让GPU持续饱和运行,毫末历经两年研发,建立了全套面向大规模训练的Data Engine,实现了百P数据筛选速度提升10倍、百亿小文件随机读写延迟小于500微秒。在算力优化方面,毫末与火山引擎合作,部署了Lego高性能算子库、ByteCCL通信优化能力、以及大模型训练框架。软硬一体,把算力优化到极致。在训练效率方面,基于Sparse MoE,通过跨机共享,轻松完成千亿参数大模型训练,且百万个Clips(毫末视频最小标注单位)训练成本只需百卡周级别,训练成本降低100倍。

(MANA OASIS基础能力展示)

在MANA OASIS的加持下,毫末MANA五大模型全新亮相升级,助力毫末自动驾驶高速发展:其中,视觉自监督大模型,让毫末在中国首个实现4D Clip的自动标注;3D重建大模型,助力毫末做数据生成,用更低成本解决数据分布问题,提升感知效果;多模态互监督大模型,则可以完成通用障碍物的识别;动态环境大模型则进一步使用重感知技术,降低对高精地图依赖;人驾自监督认知大模型让毫末的驾驶策略更加拟人化,安全及顺畅。

(MANA五大大模型助力自动驾驶能力发展)

首先,视频自监督大模型,让毫末4D Clip标注实现100%自动化,人工标注成本降低98%。为了更低成本、更高效获取更多高价值数据,需要解决从离散帧自动化扩充到Clips形态的问题。毫末首先利用海量videoclip,通过视频自监督方式,预训练出一个大模型,用少量人工标注好的Clip数据进行Finetune(微调),训练检测跟踪模型,使得模型具备自动标注的能力;然后,将已经标注好的千万级单帧数据所对应的原始视频提取出来组织成Clip,其中10%是标注帧,90%是未标注帧,再将这些Clip输入到模型,完成对90%未标注帧的自动标注,进而实现所有单帧标注向Clip标注的100%的自动转化,同时降低98%的Clip标注成本。毫末视频自监督大模型的泛化性效果极佳,即使是在一些非常困难的场景,例如严重遮挡的骑行者,远处的小目标,恶劣的天气和光照,都能准确地完成自动标注。

(视觉自监督大模型,可以完成4D Clip的自动标注)

其次,3D重建大模型,让毫末实现了数据“无中生有”,获得海量corner case(长尾场景)不再是难事。面对“完全从真实数据中积累的corner case困难且昂贵”的行业难题,毫末将爆火的三维重建NeRF技术应用在自动驾驶场景重建和数据生成中,它通过改变视角、光照、纹理材质的方法,生成高真实感数据,实现以低成本获取normal case,生成各种高成本corner case。3D重建大模型生成的数据,不仅比传统的人工显式建模再渲染纹理的方法效果更好、成本更低,增加NeRF生成的数据后,还可将感知的错误率降低30%以上。

(3D重建大模型,用更低成本解决数据分布问题,提升感知效果)

第三,多模态互监督大模型,让车辆长出“火眼金睛”,精准识别异形障碍物。在成功实现车道线和常见障碍物的精准检测后,针对城市多种异形障碍物的稳定检测问题,毫末正在思考和探索更加通用的解决方案。多模态互监督大模型引入了激光雷达作为视觉监督信号,直接使用视频数据来推理场景的通用结构表达。通用结构的检测,可以很好地补充已有的语义障碍物检测,有效提升自动驾驶系统在城市复杂工况下的通过率。

(多模态互监督大模型,可以完成通用障碍物的识别)

第四,动态环境大模型,可以精准预测道路的拓扑关系,让车辆始终行驶在正确的车道中。在重感知技术路线下,毫末为了将对高精地图的依赖度降到最低,面临着“道路拓扑结构实时推断”的挑战。为此,毫末在BEV(鸟瞰图)的feature map(特征图)基础上,以标精地图作为引导信息,使用自回归编解码网络,将BEV特征,解码为结构化的拓扑点序列,实现车道拓扑预测,让毫末的感知能力,能像人类一样在标准地图的导航提示下就可以实现对道路拓扑结构的实时推断。毫末认为,解决了路口问题实际就解决了大部分城市NOH问题,目前在保定、北京,毫末对于85%的路口拓扑推断准确率高达95%。即便是非常复杂、非常不规则的路口,毫末也能准确预测。

(动态环境大模型,让毫末进一步使用重感知技术,降低对高精地图依赖)

第五,人驾自监督认知大模型,掌握高水平司机的开车技法,让驾驶决策更聪明。在探索“使用大量人驾数据,直接训练模型做出拟人化决策”方面,毫末为了让模型能够学习到高水平司机的优秀开车方法,全新引入了用户真实的接管数据,同时用RLHF(从人类反馈中强化学习)思路先训练一个reward model(奖励模型)来挑选出更好的驾驶决策。通过这种方式,使毫末在掉头、环岛等公认的困难场景中,通过率提升30%以上。这与AGI领域爆火的ChatGPT的思路相同,通过人类行为反馈来选出最优答案。

(人驾自监督认知大模型,毫末的驾驶策略更加拟人化,安全及顺畅)

MANA五大模型全面提升了毫末感知和认知层面系统化的底层技术能力。“在五大模型助力下,MANA最新的车端感知架构,从过去分散的多个下游任务集成到了一起,形成一个更加端到端的架构,包括通用障碍物识别、局部路网、行为预测等任务,毫末车端感知架构实现了跨代升级。”顾维灏表示。这也意味着毫末的感知能力更强,产品力更强,向全无人驾驶加速迈进。

(MANA五大模型助力毫末感知架构实现跨代升级)

2023毫末城市NOH大规模量产落地,2025全面迈入全无人驾驶时代

现场顾维灏正式公布了毫末辅助驾驶产品HPilot的发展计划:预计到2024年上半年,毫末将完成HPilot落地中国100个城市的计划,实现点点互达。到2025年,更大规模全场景的NOH将更快落地,全面迈入全无人驾驶时代。

(毫末HPilot发展规划)

顾维灏表示,毫末城市NOH是中国首个可大规模量产的城市导航辅助驾驶。毫末城市NOH的领先性表现在:重感知技术路线领先,大模型的技术应用领先,用户闭环数据建设领先。

(顾维灏揭秘毫末NOH三大领先性)

自动驾驶领域产学研重磅嘉宾助阵AI DAY,毫末豪华朋友圈持续扩大

自动驾驶领域产学研重磅嘉宾豪华阵容齐聚本届HAOMO AI DAY。中国互联网协会是本届HAOMO AI DAY指导单位,中国互联网协会副理事长何桂立进行了开场致辞;中国科学院自动化研究所复杂系统管理与控制国家重点实验室主任王飞跃,长江学者、国家杰出青年基金获得者、万人计划科技创新领军人才、北京交通大学教授赵耀分享了全球自动驾驶技术前沿洞察;火山引擎总裁谭待、达达集团联合创始人兼CTO杨骏、魏牌摩卡商品总监徐通、高通公司产品市场高级总监艾和志、欧拉闪电猫商品总监曾雷等伙伴,分享了与毫末合作的最新进展。英特尔中国研究院智能驾驶实验室总监、首席研究员吴向斌出席演讲。

(毫末智行合作伙伴出席HAOMO AI DAY)

王飞跃表示,“希望中科院自动化所与毫末智行通力合作,能建立起毫末在自动驾驶技术领域的技术体系和理论体系,让全世界相关科研人员能共享毫末的成果。”

目前毫末与北京交通大学计算机与信息技术学院,就自动标注相关技术领域展开了深入合作。赵耀表示,“期待未来与毫末一起,在人才培养、技术研发、行业标准制定方面加强合作,建立技术护城河,携学界和企业之力共同将中国自动驾驶做大做强。”

杨骏表示,感谢像毫末这样非常优秀的国内无人车企业,达达与毫末携手进行非常有价值的无人配送探索,为行业发展奠定良好基础。

吴向斌表示,希望毫末智行抓住机遇,持续创新,开放共赢,为中国特色智能网联汽车贡献力量。

此外,北京、深圳等地相关政府主管部门、专业机构、协会,阿里、美团、腾讯、百度、京东、字节跳动、四维图新、高德、迪信通、宝马、奔驰、现代、比亚迪、奇瑞、长城、高通、英特尔、瑞萨、寒武纪、速腾聚创、毫末投资人等伙伴以线上或线下方式参与了本次活动直播。

顾维灏在演讲最后表示:“凡是经历,皆为馈赠。毫末最为制胜的武器,是毫末同学们在一起而形成的迎难而上的创业精神,这种无敌的创业精神是我们面对挑战,取得领先,不断向前的最大法宝。毫末希望携手更多同路人,一起做更多有意义的事情。”张凯在演讲最后全新发布毫末愿景:“让机器智能移动,给生活更多美好。”这也是第七届HAOMO AI DAY的主题。本届HAOMO AI DAY所展现的信心及发布内容,在严寒冬日里,以温暖的力量,努力为行业照亮着火种。2023年伊始,毫末将向新的三年全力迈进。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/67699.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

张俊林:由ChatGPT反思大语言模型(LLM)的技术精要(2)

原文:张俊林:由ChatGPT反思大语言模型(LLM)的技术精要(2) 02 学习者:从无尽数据到海量知识 从目前研究结果看,Transformer是足够强大的特征抽取器,尚不需要做特别的改进…

【初探人工智能ChatGPT】2、雏形开始长成

【初探人工智能ChatGPT】2、雏形开始长成 【初探人工智能ChatGPT】2、雏形开始长成安装Flask封装Web接口雏形设置接收参数功能验证聊天写代码代码补全生成图片 写在后面 笔者初次接触人工智能领域,文章中错误的地方还望各位大佬指正! 【初探人工智能Chat…

马斯克要求 Twitter 程序员写周报,具体到代码行数!

来源:InfoQ 11 月 24 日,据 Business Insider 报道,推特内部邮件显示,该公司要求技术类员工必须每周发邮件给 CEO 埃隆马斯克(Elon Musk),介绍自己本周的所有工作,以此实现“快速创新…

马斯克的推特“大清洗”:高管、员工、研究学者、高仿号,以及前女友

大数据文摘出品 Let that sink in。 10月24日,马斯克就真的抱着一个水槽,走进了Twitter的总部大楼。 磨磨蹭蹭半年,马斯克终于完成了对Twitter的收购,如愿接过Twitter的指挥权杖。 马斯克拿下推特之后,各种新闻几乎布满…

马斯克在推特回应推特起诉:真讽刺,我笑了

万博 发自 凹非寺量子位 | 公众号 QbitAI 马斯克和推特之间的“连续剧”,又更新了一集: 《推特正式起诉马斯克》。 并且在诉状中,推特还细数了马斯克决意收购前后的种种恶行。 核心态度是: 我方纯属无辜,马斯克必须按照…

6月无代码资讯|OutSystems与微软合作,将生成式AI整合在低代码产品;首个自然语言开发框架PromptAppGPT发布

一、TOP3 大事件 1、用ChatGPT开发代码!OutSystems与微软合作,增强低代码开发 6月22日,全球低代码领导者OutSystems在官网宣布与微软达成深度技术合作,将生成式AI全面整合在低代码产品矩阵中。 据悉,OutSystems通过…

使用CNN+LSTM进行脑电情绪识别

写了一份适合刚入门脑电情绪识别的一个可用于练手的代码讲解。 首先再进行用脑电信号进行情绪识别时会对数据进行一个处理,比如计算出微分熵,功率谱图等。 在这里我们首先采用计算出微分熵DE。 微分熵 微分熵是香农信息熵在连续变量上的推广形式&…

神经元激活函数

神经元激活函数 激活函数(Activation functions),将非线性特性引入到网络中。如下图,在神经元中,输入的 inputs 通过加权,求和后,还被作用了一个函数,这个函数就是激活函数。 引入激活函数是为了增加神经…

独家 | 人工神经网络中发现了人类大脑拥有的多模态神经元(附链接)

作者:Gabriel Goh, Chelsea Voss, Daniela Amodei, Shan Carter, Michael Petrov, Justin Jay Wang, Nick Cammarata, and Chris Olah 翻译:欧阳锦 校对:王可汗本文约4000字,建议阅读12分钟本文探讨了OpenAI在CLIP模型中发现人类大…

神经网络(三)—— 神经元多输出

本系列为慕课网《深度学习之神经网络(CNN/RNN/GAN)算法原理实战》视频笔记,希望自己能通过分享笔记的形式更好的掌握该部分内容。 往期回顾: 神经网络(一)—— 机器学习、深度学习简介 神经网络(二)—— 神…

3D U-Net脑胶质瘤分割BraTs + Pytorch实现

原论文地址: 连接 一、网络模型的分析和对比 原始2D-Unet网络模型 我的2D-Unet网络模型 1、和原来的2D-Unet网络不同的是,我输入通道为4,我这里应该改为4个通道,对应四个模态图像,而输出通道为3,我对应的是三个嵌套子区域标签(WT、TC、ET) 2、另外,最大不同的是我的3X3卷积…

深度学习(一)——MP神经元模型, BP算法, 神经元激活函数, Dropout

https://antkillerfarm.github.io/ 前言 神经网络本质上不是什么新东西。十年前,我还在上学的时候,就接触过皮毛。然而那时这玩意更多的还是学术界的屠龙之术,工业界几乎没有涉及。 及至近日重新拾起,方才发现,这十…

单个人工神经元模型示意图,人体神经元模型制作

人工神经元的基本构成 人脑的神经元模型如图8.6所示。图中一个神经元由细胞核、一个轴突、多个树突、突触组成。生物电信号从树突传入,经过细胞核处理,从轴突输出一个电脉冲信号。 神经元通过树突与轴突之间的突触与其他神经元相连构成一个复杂的大规模…

神经元的细胞体内有什么,神经元的细胞体在哪里

神经元细胞体位于哪里? 谷歌人工智能写作项目:神经网络伪原创 你知道神经元在我们身体的哪个部位吗? 神经元的基本结构包括细胞体和突起.神经元的突起一般包括一条长而分枝少的轴突和数条 短而呈树状分枝的树突.轴突以及套在外面的髓鞘,叫做神经纤维.…

03 神经元多输入

神经元多输入 上一篇博客介绍了二分类的逻辑回归模型。如果我们想要多分类的逻辑回归模型,我们该怎么做呢? 很显然,我们在只有一个神经元的时候可以做二分类的问题。如果我们想要多分类的话,直接加神经元的个数就好了,…

人脑部神经网络分布特点,人脑部神经网络分布图

人的大脑的怎么分配的 大脑(Brain)包括左、右两个半球及连接两个半球的中间部分,即第三脑室前端的终板。大脑半球被覆灰质,称大脑皮质,其深方为白质,称为髓质。髓质内的灰质核团为基底神经节。在大脑两半球间由巨束纤维—相连。 …

人体内数量最多的神经元,人体内有多少个神经元

人体内平均有多少神经元? 。 约含有140亿个神经元胞体虽然神经元形态与功能多种多样,但结构上大致都可分成胞体(cellbody,orsoma)和突起(neurite)两部分.突起又分树突(dendrite)和…

【计量经济学】【高教版】第二次作业

第二次作业: 教材:伍德里奇。计量经济学导论:现代观点(第五版)。 第三章习题:必做 1,2,5,6,11,选做13 第四章习题:必做2,3,4,5,8,选做9,10,11 第三章 1.多元线性回归模型的基本假设是什么?在证明最小二乘估计量的无偏性和有效性的过程中,哪些基本假设起…

【计量经济学】【高教版】第一次作业(7、8、10)

第二次 7.假设有人做了如下的回归: y i = β 0 ^ + β 1 ^ x i + e i y_i=\widehat{\beta_0}+\widehat{\beta_1}x_i+e_i yi​=β0​ ​+β1​ ​xi​+ei​ 其中, y i , x i y_i,x_i yi​,xi​分别为 Y i , X i Y_i,X_i Yi​,Xi​关于各自均值的离差。问 β 0 ^ 和 β 1 ^ \…

软件工程经济学作业5-7

1.什么是生产函数? 其主要特征是什么? 答:生 产函数是指一定时期内生产要素的数量与某种组合同其所能出产的最大产量之间存在的函数关系。 生产函数通常满足以下三个特征: (1 ) 资本 与劳动力的边际产出总是为正值, 在…