华为的大模型终于来了,我的评价是:相当震撼

华为的大模型终于来了,我的评价是:相当震撼


老被人说在大模型竞赛中掉队的华为,这次终于带着它的家伙事儿来了。


这不,在昨天的华为开发者大会 2023 上,华为就狠狠地秀了一把。


将近三个小时的发布会,还是继承了华为以往大杂烩的风格,看得世超是眼花缭乱。


不过,总结下来其实也就突出了一个主题:盘古大模型 3.0 。


其实就在前几天,当别的大模型还在比各种评分的时候,盘古靠着世界顶级期刊 Nature 认证的金字招牌,以一种别具一格的方式进入了大家的视野。


据说,加入了盘古大模型,气象预测的速度提高了 10000 倍以上,几秒钟就能出结果,台风打哪来,几点来,啥时候走,都能给你预测得明明白白的。


最主要的是,它的预测精度甚至超过了号称全球最强的欧洲气象中心的 IFS 系统,算是头一个 AI 预测赢了传统数值预测的产品。


要知道,以往的 AI 气象预测多是基于 2D 神经网络开发,但气象这玩意实在是太复杂了,2D 着实有点儿吃不消。


而且,之前的 AI 模型会在预测的过程当中不断累计迭代的误差,容易影响到结果的精确性。


所以 AI 预测方法一直都不咋受待见。


而盘古气象大模型牛就牛在,他们用了个叫 3DEST 的三维神经网络来处理气象数据, 2D 干不了的那就换 3D 来。


3DEST 的网络训练和推理策略


针对迭代误差的问题,模型还用了个 “ 层次化时域聚合策略 ” 来减少迭代误差,从而提高预报的精度。


这词儿虽然听起来挺容易被唬住的,但其实很好理解。


就比如,之前的 AI 气象预测模型 FourCastNet ,在台风来之前,它会提前 6 小时进行预测,在这 6 个小时里,模型会多次计算台风到底啥时候来。


可能一会儿算出来 5 个小时,一会儿又算出来 4 个半小时,这些结果加到一起误差就大了。


但盘古气象大模型想了个法子,训练了 4 个不同预报间隔的模型,分别是 1 小时迭代 1 次,还有 3 小时、 6 小时和 24 小时迭代 1 次。


再根据具体的气象预测需求,选择相应的模型进行迭代。


就比如说,咱们如果要预测未来 7 天的天气,那就让 24 小时的模型迭代 7 次;预测 20 个小时就是 6 小时的模型迭代 3 次 +1 小时的迭代 2 次。


迭代次数越少,误差也就越小。


这波操作,让天气预报又迈向了一个新的 level 。


不过,可能有差友开始犯嘀咕了,人家的大模型都是生成图像和文字,怎么到华为这就变成了天气预报了?


有一说一啊,这盘古大模型跟咱之前接触到的 ChatGPT 、 Midjourney 的确不太一样,人家做的是行业的生意。


简单来理解,就是盘古大模型咱个人一般用不上。


它并不是大家期待的 ChatGPT“ 克星 ” ,而是针对平时不太能接触到的To B 市场。


咱先不提难与不难,至少华为这么多年积累下来的企业客户资源,确实很容易变现。


而且华为这次的发布会可不止带来了气象预测模型这一个狠角色。


40 多年都没发现新的抗生素,盘古药物分子大模型一来就找着了超级抗菌药 Drug X ,而且药物的研发周期从数年缩短至几个月,研发成本降低 70% 。


盘古矿山大模型也能深入到采煤的 1000 多个工序之中,而且光是里头挑选精煤的这一个环节,就能让精煤回收率提升 0.1% 到 0.2% 。


要知道,一家年产 1000 万吨焦煤的选煤厂,每提升 0.1% 精煤产率,每年就能多 1000 万的利润。


这可都是白花花的银子啊。。。


事实上,除了上边儿咱提到的天气预测、药物研发和选煤,盘古大模型在很多行业里都已经用起来了。


发布会上,华为云人工智能首席科学家田奇就表示,华为云人工智能项目已经应用在了超过 1000 个项目中,其中 30% 用在客户的核心生产系统里,平均推动客户盈利能力提升了 18% 。


而华为能够量产这些各不相同的行业大模型,要归功于华为盘古大模型 3.0 的 5+N+X 三层架构。


正是这种结构,让盘古能够快速落地到各个行业里。


为什这么说呢?


因为 AI 落地行业,数据是一大难点。


张平安在发布会上就说, “ 由于行业数据获取难,技术与行业结合难,大模型在行业的落地进展较慢。 ”


而盘古则很巧妙,通过 5+N+X 的三层架构,直接把这个大难题拆成了 3 个小问题来解决。


首先,是先让盘古 L0 层的 5 个大模型,学习了上百 TB 的百科知识、文学作品、程序代码等文本数据,以及数 10 亿张带文本标签的互联网图像。


咱们可以理解为,先让第一层 L0 的大模型( 自然语言大模型、视觉大模型、多模态大模型、预测大模型、科学计算大模型这 5 个基础大模型 )建立起基本的认知,也就是有点像咱们大学前的素质教育阶段。


然后,在第二层 L1 中的模型,则是让 L0 中的某一个基础大模型学习 N 个相关行业的数据形成的。这就像大学的本科阶段,需要选择各种专业去学习。


打个比方,医院里的 CT 影像检测跟工厂的图像质检虽说用的都是视觉大模型。


但毕竟一个是医院,一个是工厂,使用场景完全不一样,光靠基础大模型那肯定行不通,但如果把行业数据加进去,可能就有惊喜了。


最后的 L2 ,则类似研究生,会在具体行业的基础上再细化到某个场景。比如在仓储物流行业里,货物的运输、入库、出库可能都需要用到不一样的部署模型。


与此同时呢,华为还在里头加入一个反馈环节,有点进公司实习内味了。


根据他们的说法,过去开发一个 GPT-3 规模的行业大模型,通常需要 5 个月;而有了这套东西,开发周期能缩短至原来的 1/5 。


同时很多行业数据集小的限制也能被解决。比如造大飞机这种很细很细的行业,也能有大模型。


除了这一套大模型,华为这次还提出了个非常有意思的东西——算力国产化。


众所周知,咱们在 AI 算力方面,确实是比较尴尬。


一来, AI 行业的核心设备英伟达的 H100/A100 咱们买不到,二来,即使英伟达 “ 贴心 ” 出了平替 H800 ,但是也有所保留。比如,在传输速率上就砍了不少。


在大模型动辄几个月训练时间的背景之下,这就很容易被算力更强的国外同行弯道超车。


而这一回,针对这个问题,华为还是掏了些真家伙出来的。


比如,在纸面性能上,华为的昇腾 910 处理器已经够上了英伟达 A100 。


不过实际应用起来,还是有一些差距的。而且 A100 这也不是英伟达的终极武器。


但是,昇腾已经受到了不少友商的认可。华为甚至在发布会上,直接表示 “ 中国一半大模型的算力都是由他们提供的 ” 。


当然,华为这会儿在算力上的亮点,更像是整个软件生态带来的。


比如,根据发布会的说法,算上 AI 昇腾云算力底座、计算框架 CANN 。。。等环节,华为在训练大模型方面,效率是业界主流 GPU 的 1.1 倍。


还有,他们给用户制定好了全套的应用套餐。


例如,美图仅用 30 天就将 70 个模型迁移到了华为生态。同时华为还表示,在双方的努力下,AI 性能较原有方案提升了 30% 。


还是挺可观的。


而且华为还说,他们现在有近 400 万的开发者,这个数量,是和英伟达 CUDA 生态对齐了。


这一系列的动作,算是把短板补上了一部分。


总的来说,一场华为发布会看下来,差评君觉得华为在 AI 方面的布局是很深刻的,他们早就开始思考 “AI 真正能带给我们什么 ” 这个问题了。


过去半年里, AI 行业虽然掌声雷动,但是真正落到行业层面,多少有些尴尬。


而华为的这一次动作,恰好印证了如任正非说的:


“ 未来在 AI 大模型方面会风起云涌的,不只是微软一家。人工智能软件平台公司对人类社会的直接贡献可能不到 2% , 98% 都是对工业社会、农业社会的促进。 ”


AI 领域,真正的大时代还在后头。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/6382.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

乔布斯离开后的苹果 | 历史上的今天

整理 | 王启隆 透过「历史上的今天」,从过去看未来,从现在亦可以改变未来。 今天是 2023 年 2 月 2 日,在 1913 年的今天,世界最大的火车站——纽约中央车站(Grand Central Terminal)正式启用。美国纽约中央…

2023 年云计算的增长点在何处?

作者 | 孙琦(万博智云 CTO 及联合创始人) 编辑 | 宋慧 出品 | CSDN 云计算 编者注: 2023 年已来,数字化转型仍然是 IT 的主旋律。不过,与以往一窝蜂、追求形式化的数字化不同,在疫情和日益增加的外部压力下…

人工智能发展月报(2023年1月)

本期导读 兔年伊始,人工智能业界已呈现出竞争加速之态势。不仅对话机器人ChatGPT为科技大厂们带来了技术与产品迭代的竞争压力,而且美国和欧盟达成的AI联手研发协议也为诸多国家带来了战略发展的竞争压力,2023年全球人工智能发展必将掀起新篇…

前瞻洞察|Prompt Learning(提示学习)——新的低资源场景克星

近年来,预训练语言模型已然成为自然语言处理(NLP)领域中备受瞩目的技术之一。预训练模型可以在大规模文本语料上进行自监督学习,从而获得丰富的语言学知识,并通过在下游任务上进行微调,实现出色的性能。Pro…

AIGC周报|下一个裁谁?老板:问问AI;OpenAI推出Shap·E;库克:AI仍有不少问题要解决

AIGC(AI Generated Content)即人工智能生成内容。近期爆火的 AI 聊天机器人 ChatGPT,以及 DallE 2、Stable Diffusion 等文生图模型,都属于 AIGC 的典型案例,它们通过借鉴现有的、人类创造的内容来快速完成内容创作。 …

python selenium 实现页面元素捕捉及信息交互

1引入相关库 from selenium import webdriver from selenium.webdriver.common.by import By import time import json2.这里以b站为例,这里使用cookie登录b站,用其他方式登录也可 #d访问bilibili url https://www.bilibili.com/ driver webdriver.Chrome() dri…

人工智能轨道交通行业周刊-第47期(2023.5.29-6.4)

本期关键词:郑州智慧地铁、货运安全监控、激光炮、6C系统、越行站、ChatGPT原理 1 整理涉及公众号名单 1.1 行业类 RT轨道交通人民铁道世界轨道交通资讯网铁路信号技术交流北京铁路轨道交通网上榜铁路视点ITS World轨道交通联盟VSTR铁路与城市轨道交通RailMetro轨…

4步掌握“指令工程”,使用ChatGPT进行高效AI创作

通过有效的指令发挥AI写作的能力,让你领先99%的用户。 微信搜索关注《Python学研大本营》,加入读者群,分享更多精彩 你是否曾对AI生成的内容感到失望?也许你认为ChatGPT的输出很不靠谱,完全达不到期望。 然而事实是&am…

ChatGPT克星,介绍5款免费又好用的AIGC检测工具

各种AI生成的内容海量涌入,介绍用于检查各项文本内容是否由AI生成的顶级免费工具。 微信搜索关注《Python学研大本营》,加入读者群,分享更多精彩 简介 ChatGPT推出后,犹如潘多拉魔盒被打开了。我们现在正观察到许多工作方式的技术…

「ChatGPT克星」升级:老师可以把全班作业丢进去检测了!华人作者:免费用

金磊 发自 凹非寺量子位 | 公众号 QbitAI 「ChatGPT克星」,升级了! 没错,就是之前华人小哥Edward Tian所打造出来的那个GPTZero,几秒内就能摸清文字是人类还是AI写的。 而时隔近一个月,小哥所推出的版本名叫GPTZeroX&a…

ChatGPT「克星」来了!文章作者是人是AI几秒检出,华人小哥元旦假期搞定,服务器已挤爆...

丰色 杨净 发自 凹非寺量子位 | 公众号 QbitAI 你说ChatGPT,它写的东西逼真到傻傻分不清? 没关系! 现在,它的“克星”来了—— 一位华人小哥专门搞了这么一个网站,专门鉴别文字到底是出自于AI还是人类。 你只需要把相应…

ChatGPT“克星”:用AI识别AI生成的文本,英语论文阅读笔记都能测出

萧箫 发自 凹非寺量子位 | 公众号 QbitAI ChatGPT的出现,让不少人看到了交期末大作业的曙光(手动狗头)。 无论是英语论文、还是阅读笔记,只要在ChatGPT的知识范围内,都可以拜托它帮忙完成,写出来的内容也有…

ChatGPT人工智能浪潮所带来的产业机会

李彦宏在文心一言的发布会说过,深入理解ChatGPT人工智能浪潮所带来的产业机会,其中提到大模型时代将产生三大产业机会:通用大模型、行业大模型和AI应用。 这三个产业机会就是一个金字塔结构,最顶层的就是通用大模型,只…

“AI+”概念是什么?(附十大概念股)

所谓AI即人工智能(Artificial Intelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。 而AI应用概念即指应用AI技术的下游场景,这是一个非常大的概念&#xf…

人工智能算法 上市公司,人工智能算法公司排名

人工智能上市公司龙头股票有哪些 一、科大讯飞(002230),属于人工智能稀缺标的,多领域布局苦尽甘来,业绩拐点临近。二、浪潮信息(000977),人工智能基础设施提供商,目前具备业界最全CPU服务器产品线。 三、中科曙光(60…

九龙证券|人工智能+国产软件+智慧城市概念股火了,欧洲资管巨头大举抄底

近一周组织调研个股数量有130多只,迈瑞医疗成为调研组织数量最多的股票。 证券时报数据宝统计,近一周组织调研公司数量有130多家。从调研组织类型来看,证券公司调研相对最广泛,调研80多家公司。 迈瑞医疗获超500家组织调研 迈瑞…

人工智能神经网络概念股,神经网络芯片概念股

1、人工智能概念股有哪些? 人工智能芯片谁是龙头? 人工智能包含硬件智能、软件智能和其他。 硬件智能包括:汉王科技、康力电梯、慈星股份、东方网力、高新兴、紫光股份。 软件智能包括:金自天正、科大讯飞。 其他类包括&#x…

智能算法和人工智能算法,人工智能算法概念股票

人工智能股票有哪些? 1、苏州科达:苏州科达科技股份有限公司是领先的视讯与安防产品及解决方案提供商,致力于以视频会议、视频监控以及丰富的视频应用解决方案帮助各类政府及企业客户解决可视化沟通与管理难题。 2012年,公司整体…

苹果进军人工智能:测试类似 ChatGPT 的聊天机器人

Apple 一直是技术先驱,不断推出突破性创新,重新定义用户体验。为了继承这一传统,这家科技巨头现在正在探索人工智能驱动的聊天机器人的潜力,以增强用户交互。有报道称,苹果正在测​​试类似 ChatGPT 的人工智能聊天机器…

基于ChatGPT的智能问答机器人——ShuDong AI

ShuDong AI(中文名:树洞AI)是一款基于ChatGPT的生成式AI机器人,支持文字聊天(中文或英文)、语音聊天(中文或英文),画图等能力。它可以做您的树洞,提供发泄情绪…