没等来百度惊艳的All in AI,却等来了国产之光的盘古大模型 5.0

6月21日,华为开发者大会(HDC 2024)在广东东莞正式开幕。盘古大模型5.0的更新,也是此次HDC2024的另一项重头戏。在过去的一年中,盘古大模型正在疯狂向各行各业渗透。

此次,华为方面展示了他们在具身智能、医药、气象、铁路、媒体、钢铁等领域的应用。据介绍,一年的时间,盘古大模型已经落地到30多个行业、400多个场景,堪称火箭速度。

盘古大模型5.0超强升级

在这里插入图片描述

盘古大模型5.0包含不同参数规格的模型,以适配不同的业务场景。

  • 十亿级参数的Pangu E系列可支撑手机、PC等端侧的智能应用,无需联网,即可运行小型大模型;

  • 百亿级参数的Pangu P系列,适用于低时延、低成本的推理场景;

  • 千亿级参数的Pangu U系列适用于处理复杂任务,可以成为企业通用大模型的底座;

  • 万亿级参数的Pangu S系列超级大模型是处理跨领域多任务的超级大模型够能帮助企业更好的在全场景应用AI技术。

在这里插入图片描述

特点

1. 强思维

复杂逻辑推理是大模型成为行业助手的关键。

盘古大模型5.0通过结合先进的思维链技术和策略搜索技术,显著提升了其解决数学问题和规划复杂任务的能力。这种提升让盘古大模型5.0在帮助各行业解决问题时,更加出色,能够轻松应对更复杂的逻辑推理挑战。

简单来说,这个升级版的大模型变得更聪明了,可以帮助企业更好地解决困难问题。

2. 多模态

盘古大模型5.0在3.0的基础上,能够进一步理解和生成包括文本、图片、视频、雷达、红外、遥感等更多模态的信息,赋能和重塑千行百业。

在处理图片和视频方面,它支持非常高的分辨率(达到10K),而在内容创造上,则采用了业界首创的可控时空生成技术,这种技术特别适用于自动驾驶、工业制造和建筑等领域,可以创建符合物理规律的多模态内容。

例如,使用这个模型,在多模态识别方面,它能够通过分析卫星遥感图片来判断农作物的生长情况,帮助预测产量或监测病虫害;利用红外技术,能在夜间准确识别车辆位置,帮助管理交通违规停车;同时,结合可见光和雷达数据,盘古5.0能够评估一个区域的植被覆盖情况,辅助自然保护工作。

当前,算力也是阻碍大模型行业发展的一道难关。除了盘古大模型的创新升级,华为云还对昇腾AI云服务进行持续优化。

比如,行业中万亿参数模型训练的平均无中断时长大概是2.8天,而采用昇腾AI云服务时,可实现40天无中断;业界平均集群故障恢复时间约60分钟,而昇腾AI云服务可以缩短到10分钟,同时能将大模型的资源开通时间从月级缩短到天级。

目前,昇腾AI云服务已全面适配行业主流的100多个大模型,以云服务的方式,帮助客户开发,训练,托管和应用模型。

盘古大模型,如何落到各行各业?

在过去的一年中,盘古大模型持续深耕行业,已在30多个行业、400多个场景中落地,在政务、金融、制造、医药研发、煤矿、钢铁、铁路、自动驾驶、工业设计、建筑设计、气象等领域发挥作用。

  • 自动驾驶
    华为云盘古大模型5.0采用了先进的可控时空生成技术(STCG),使其生成的视频在视觉效果上不仅逼真,更在车辆行为和环境互动等方面高度仿真,确保了在不同视角、天气和光照条件下的自然连贯性。

    此外,模型还为自动驾驶系统提供了全方位、高仿真度的训练视频,这些视频从六个不同的摄像头视角展示了从空旷街道到复杂的多车互动场景,并涵盖了多种气候条件,显著增强了数据集的丰富性和多样性。

    在技术细节上,该模型能够精确模拟雨天环境下车辆尾灯因暗淡光线而自动开启的情形,展现了其对真实世界复杂现象的深入理解与模拟能力。这一技术不仅提升了训练素材的质量,也为自动驾驶研究和开发提供了强大的支持。
    在这里插入图片描述

  • 让汽车设计更快
    据介绍,在汽车造型设计领域,盘古大模型已成功将传统的1-2年设计周期显著缩短。

    比如,设计师可以通过对话和绘图与大模型交互,快速生成并调整3D汽车模型,包括风格、零部件和颜色的定制。而这些数字模型可以直接输出为多种主流3D格式,允许设计师直接进行3D打印,从而减少了传统油泥模型的需求,大幅节约了成本和时间。

    盘古大模型还将应用范围还扩展到了汽车的工装设计、模具设计以及电子产品的工业设计等领域。

  • 从草图到建筑大师作品,仅需数十分钟
    华为云的盘古大模型通过其可控生成能力,让建筑师可以仅凭一张黑白草图快速生成带有纹理的彩色建筑群360°实景视频。

    此外,利用盘古的3D重建技术,建筑师能够在短短几十分钟内构建出高度真实感的建筑3D模型,大幅度缩短了复杂建筑群的概念设计周期,原本需要数周的时间现在只需数十分钟。这一突破性技术不仅提高了设计效率,还帮助建筑师创作出更加卓越的建筑作品。

    在这里插入图片描述

  • 让实拍视频流畅变成动漫
    通过华为云盘古媒体大模型,可以将实拍视频转换为不同风格的高清动漫。

    比如,在现场演示的生成视频中,演员的舞蹈、武打等大运动轨迹能保持一致视觉效果,角色的面貌特征也保持前后一致。这意味着,将大大提升视频制作效率,作品一次拍摄可以多次制作。

    语音也是视频中很重要的一环。在语音方面,盘古大模型通过AI原声译制与视频生成能力,能够让原片译制成不同语言的视频,并保留原始角色的音色、情感和语气。更为重要的是,盘古还能同步生成新的口型。

    在AI翻译方面,华为云盘古大模型也对云会议系统进行了升级。通过基于大模型的语音复刻、AI文字翻译以及TTS技术,实现了语音的同声传译,这使得不同国家的人在云视频会议中,也可以流畅使用母语交流。

  • 大模型,让钢铁公司每年多产2万吨钢
    在钢铁领域,华为盘古大模型已经开始发挥作用。比如,宝武钢铁集团热轧生产线里,在一块厚260mm的钢坯被轧制成1.2毫米厚的钢板前,需要经过20道工序,且每次调整生产钢板的种类和尺寸时,都需要工程师重新调整,一次需要耗费约5天的时间。

    而有了盘古大模型的帮助,将时序数据、表格数据、工艺参数、行业机理等token化,通过大模型的学习,实现对最优的参数进行预测,显著降低了热轧生产线调优时间,并提高预测精度和钢板成材率。

    从效果来看,盘古大模型在钢铁行业的预测精度提高5%以上,钢板成材率提升0.5%,预计每年可以多产钢板2万余吨,年收益达9000余万元。此外,华为云还与宝武钢铁集团在炼钢、表检、新钢种研发、排程优化等多个领域开展盘古大模型的应用研究。

  • 预测天气
    此次,华为盘古气象大模型也在推进更高难度的公里级区域预报,实现了从全球25公里模型向1公里、3公里、5公里区域预报精度的跨越,包含气温、降雨、风速等气象要素。

    值得注意的是,气象大模型的应用范围已经延伸至行业服务,扩展到污染物预测、农业生产指导等多个领域,成为支持各行各业决策的重要工具。

    尤其是在环境治理方面,华为云与天融环境公司的合作推出了“环境大模型”,将污染六项的预测准确度全面提升10%以上,并且将预测窗口从3天提前至7天,为环保部门提供了更长的预警时间,有助于更加高效地进行污染源的定位与治理。

    在这里插入图片描述

  • 当大模型学习了一千本古籍
    在医药领域,天士力基于盘古大模型打造“数智本草大模型”。

    一方面基于盘古L0能力,学习训练了378万篇文献等数据,尤其是学习了1000多本古籍,从古方古籍和现代文献中总结出知识和经验,可以赋能方剂筛选和优化、提升研发效率,也能辅助医生问诊。

    另一方面,天士力在盘古17亿化合物的药物分子大模型基础上,增训了350万天然产物分子数据,未来有望更好地优化方剂和发现新药。

“夸父”机器人

盘古具身智能大模型是人形机器人的灵魂,会上还展示了乐聚公司搭载该模型的“夸父”人形机器人。

据介绍,盘古大模型能够让机器人完成10步以上的复杂任务规划,并且在任务执行中实现多场景泛化和多任务处理。

同时盘古大模型还能生成机器人需要的训练视频,让机器人更快地学习各种复杂场景。

大模型的多模态能力以及思维能力的快速提升,使机器人能够模拟人类常识进行逻辑推理,并在现实环境中高效精准地执行任务,从而有效解决了复杂环境感知与物理空间认知的难题。

通过集成多场景泛化和多任务处理能力,不论是生活场景还是工业场景,都能游刃有余的应对。

在这里插入图片描述

个人评价

总之,和老黄在宝岛上的发布会有点遥相契合的感觉。但是毋庸置疑的是 AI 时代已经到来,而他终究会对世界产生巨大的影响, 同时,对于00后和10后,甚至20后而言,AI终将会是我们未来最为丰富的宝库。

感谢大家花时间阅读我的文章,你们的支持是我不断前进的动力。期望未来能为大家带来更多有价值的内容,请多多关注我的动态!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/356412.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

squareline studio浅尝(1)在对话框添加键盘

因项目需要,需要修改IP地址等参数,需要编辑文本对话框内容,这时候就需要调用键盘,操作如下。主要为了做笔记。如有误导请及时留言。 1)拖一个键盘到对话框页面。默认把它隐藏(flag:hidden) 2&…

MURF3040CTR-ASEMI智能AI应用MURF3040CTR

编辑:ll MURF3040CTR-ASEMI智能AI应用MURF3040CTR 型号:MURF3040CTR 品牌:ASEMI 封装:TO-220F 恢复时间:35ns 最大平均正向电流(IF):30A 最大循环峰值反向电压(VR…

2024.6.23周报

目录 摘要 ABSTRACT 一、文献阅读 一、题目 二、摘要 三、网络架构 四、创新点 五、文章解读 1、Introduction 2、Method 3、实验 4、结论 二、代码实验 总结 摘要 本周阅读了一篇题目为NAS-PINN: NEURAL ARCHITECTURE SEARCH-GUIDED PHYSICS-INFORMED NEURAL N…

【面向就业的Linux基础】从入门到熟练,探索Linux的秘密(三)-shell语法

主要通过讲解shell中的一些基本语法,可以当作日常的笔记来进行查询和记忆。 文章目录 前言 一、shell 二、shell语法 1.运行方式 2.注释 3.变量 4.默认变量 5.数组 总结 前言 主要通过讲解shell中的一些基本语法,可以当作日常的笔记来进行查询和记忆。…

html--404页面

<!DOCTYPE html> <html> <head> <meta http-equiv"Content-Type" content"text/html; charsetUTF-8"> <meta http-equiv"X-UA-Compatible" content"IEedge,chrome1"> <title>404 错误页面不存在&…

某程序员:30岁了,老婆管钱,背着我买了50万股票,亏了20w,强制她清仓后又买了36万

“辛辛苦苦攒了几年钱&#xff0c;本想买房买车&#xff0c;结果全被老婆炒股亏掉了&#xff01;” 近日&#xff0c;一位30岁的程序员大哥在网上吐苦水&#xff0c;引发了网友们的热议。 这位程序员大哥和妻子结婚后&#xff0c;一直秉持着“男主外&#xff0c;女主内”的传统…

NLP大语言模型的缩放定律

一、简述 ​论文《神经语言模型的缩放定律》包含对交叉熵损失的语言模型性能的经验缩放定律的研究&#xff0c;重点关注Transformer架构。 https://arxiv.org/pdf/2001.08361.pdfhttps://arxiv.org/pdf/2001.08361.pdf 实验表明&#xff0c;测试损失与模型大小、数据集…

【软件工程】【22.04】p1

关键字&#xff1a; 软件需求规约基本性质、数据字典构成、内聚程度最高功能内聚、公有属性、RUP实体类、评审、测试序列、软件确认过程、CMMI能力等级 软件需求分类、DFD数据流图组成&#xff08;实体&#xff09;、经典详细设计、数据耦合、关联多重性、状态图、黑盒测试、…

『Z-Weekly Feed 08』加密资产观 | FHE应用前景 | OPAL协议

一位机构投资者的加密资产观 作者&#xff1a;Hongbo 01 &#x1f4a1;TL;DR 在加密投资领域如何找到真正的“价值”&#xff1a;Crypto 作为一种新兴资产&#xff0c;应该找到一种区别于传统公司股票资产的估值方法&#xff0c;本文重点阐述了加密货币作为新的资产类型与传统资…

全国实体商铺店铺商家采集工具,一键采集商家手机号,让你轻松找到目标客户

随着互联网的发展&#xff0c;越来越多的商家开始在网上开展业务&#xff0c;实体商铺的竞争也日益激烈。为了更好地吸引客户&#xff0c;很多商家都选择了线上推广和营销。然而&#xff0c;仅仅依靠线上推广是远远不够的&#xff0c;线下的实体商铺也需要积极拓展客源。因此&a…

AGI 之 【Hugging Face】 的[ 简单介绍 ] [ 基础环境搭建 ] 的简单整理

AGI 之 【Hugging Face】 的[ 简单介绍 ] [ 基础环境搭建 ] 的简单整理 目录 AGI 之 【Hugging Face】 的[ 简单介绍 ] [ 基础环境搭建 ] 的简单整理 一、简单介绍 二、Hugging Face 三、环境搭建 python 环境的搭建 Pycharm 环境搭建 1、下载 Pycharm 安装包 2、安装 …

高阶图神经网络 (HOGNN) 的概念、分类和比较

图神经网络&#xff08;GNNs&#xff09;是一类强大的深度学习&#xff08;DL&#xff09;模型&#xff0c;用于对相互连接的图数据集进行分类和回归。它们已被用于研究人类互动、分析蛋白质结构、设计化合物、发现药物、识别入侵机器、模拟单词之间的关系、寻找有效的交通路线…

Aquila-Med LLM:开创性的全流程开源医疗语言模型

​论文链接&#xff1a;https://arxiv.org/pdf/2406.12182 开源链接&#xff1a;https://huggingface.co/BAAI/AquilaMed-RL http://open.flopsera.com/flopsera-open/details/AquilaMed_SFT http://open.flopsera.com/flopsera-open/details/AquilaMed_DPO 近年来&#xf…

微服务改造启动多个 SpringBoot 的陷阱与解决方案

在系统运行了一段时间后&#xff0c;业务量上升后&#xff0c;生产上发现java应用内存占用过高&#xff0c;服务器总共64G&#xff0c;发现每个SpringBoot占用近12G的内存&#xff0c;我们项目采用微服务架构&#xff0c;有多个springboot应用。 一下子内存就不够用了&#xf…

番外篇 | YOLOv8算法解析和实战应用:车辆检测 + 车辆追踪 + 行驶速度计算

前言:Hello大家好,我是小哥谈。YOLOv8是ultralytics公司在2023年1月10号开源的,是YOLOv5的下一个重大更新版本,目前支持图像分类、物体检测和实例分割任务,在还没有开源时就收到了用户的广泛关注。它是一个SOTA模型,建立在以前YOLO版本的成功基础上,并引入了新的功能和改…

【Research】Model Stealing

What is Model Stealing? Extract an approximation that of the target model that “closely matches” the original Accuracy? Fidelity? Funtional equivalence? Threat Models API Access Model extraction using: Prediction Vectors Labels Only Model Access …

2024头歌数据库期末综合(部分题)

目录 第7关&#xff1a;数据查询三 任务描述 知识补充 答案 第8关&#xff1a;数据查询四 任务描述 知识补充 答案 本篇博客声明&#xff1a;所有题的答案不在一起&#xff0c;可以去作者博客专栏寻找其它文章。 第7关&#xff1a;数据查询三 任务描述 本关任务&#x…

[C++][数据结构][B-树][下]详细讲解

目录 1.B-树的实现1.B-树的结点设计2.插入key的过程3.B-树的插入实现4.B-树的简单验证5.B-树的性能分析6.B树的删除 2.B树3.B*树4.B-树总结5.B-树的应用0.B树可以在内存中做内查找吗&#xff1f;1.索引2.MYSQL索引简介1.MyISAM2.InnoDB 3.B树做主键索引相比B树的优势 1.B-树的实…

Mybatis-Plus多种批量插入方案对比

背景 六月某日上线了一个日报表任务&#xff0c;因是第一次上线&#xff0c;故需要为历史所有日期都初始化一次报表数据 在执行过程中发现新增特别的慢&#xff1a;插入十万条左右的数据&#xff0c;SQL执行耗费高达三分多钟 因很早就听闻过mybatis-plus的[伪]批量新增的问题&…

BL104应用在智慧零售多协议采集监控远程实时查看

在智慧零售领域&#xff0c;如今的市场竞争日益激烈&#xff0c;传统的零售模式已经难以满足消费者对服务和体验的高需求。智能化技术的引入&#xff0c;尤其是基于物联网的解决方案&#xff0c;成为提升零售业务效率和服务质量的关键。钡铼BL104 Modbus转MQTT网关作为一种先进…