华为版 ChatGPT“盘古 Chat”2023年7月7日正式发布

某些媒体,华为公司将发布一款直接对标 ChatGPT 的多模态千亿级大模型产品,名为“盘古 Chat”。

据介绍,盘古大模型于 2020 年 11 月在华为云内部立项成功。这款“盘古 Chat ”预计将于今年 7 月 7 日举行的华为云开发者大会 (HDC.Cloud 2023) 上对外发布以及内测,产品主要面向 To B / G 政企端客户。

根据华为公布的一份论文数据显示,华为盘古 PanGu-Σ 大模型参数最多为 1.085 万亿,基于华为自研的 MindSpore 框架开发。整体来看,PanGu-Σ 大模型在对话方面可能已接近 GPT-3.5 的水平。

 

IT之家查询公开资料获悉,华为盘古大模型于 2021 年 4 月正式对外发布,后来又在 2022 年 4 月升级到 2.0 版本。目前,AI 大模型中的 NLP 大模型、CV 大模型以及科学计算大模型(气象大模型)均已被标记为即将上线状态。

据介绍,这是首个千亿参数中文预训练大模型,CV 大模型则首次达到 30 亿参数。盘古 CV 大模型业界最大 CV 大模型、首次实现兼顾判别与生成能力、在 ImageNet 上小样本学习能力上的业界第一;盘古气象大模型提供秒级天气预报;紫东.太初是全球首个图、文、音三模态大模型。

对于盘古大模型定位,华为内部团队确立了三项最关键的核心设计原则:一是模型要大,可以吸收海量数据;二是网络结构要强,能够真正发挥出模型的性能;三是要具有优秀的泛化能力,可以真正落地到各行各业的工作场景。

根据华为云高管的演讲 PPT 信息,目前华为“盘古系列 AI 大模型”基础层主要包括 NLP 大模型、CV 大模型、以及科学计算大模型等,上层则是与合作伙伴开发的华为行业大模型。

华为云官网显示,盘古大模型由 NLP 大模型、CV 大模型、多模态大模型、科学计算大模型等多个大模型构成,通过模型泛化,解决传统 AI 作坊式开发模式下不能解决的 AI 规模化、产业化难题,可以支持多种自然语言处理任务,包括文本生成、文本分类、问答系统等等。

具体来看,盘古 NLP 大模型首次使用 Encoder-Decoder 架构,兼顾 NLP 大模型的理解能力和生成能力,保证了模型在不同系统中的嵌入灵活性。下游应用中,仅需少量样本和可学习参数即可完成千亿规模大模型的快速微调和下游适配,这一模型在智能舆论以及智能营销方面都有不错的表现。

 

盘古 CV 大模型是首次实现模型按需抽取的业界最大 CV 大模型,首次实现兼顾判别与生成能力,基于模型大小和运行速度需求,自适应抽取不同规模模型,AI 应用开发快速落地。使用层次化语义对齐和语义调整算法,在浅层特征上获得了更好的可分离性,使小样本学习的能力获得了显著提升,达到业界第一,这一模型在智能巡检以及智慧物流方面有不错的表现。

 

盘古气象大模型提供秒级天气预报,借助创新的 3DEST 网络结构以及分层时间聚合算法,在气象预报的关键要素和常用时间范围上精度均超过当前最先进的预报方法,速度相比传统方法提升 1000 倍以上。同时,盘古气象大模型支持广泛的下游预报方案,如在台风路径预测任务上,相比传统数值气象预报方法,盘古气象大模型可以降低 20% 以上的位置误差。

 

浙商证券此前披露的信息显示,华为在训练千亿参数的盘古大模型时调用了超过 2000 块的昇腾 910 芯片,进行了超 2 个月的数据训练能力。华为内部称,每年大模型训练调用 GPU / TPU 卡超过 4000 片,3 年的大模型算力成本高达 9.6 亿元人民币。

东吴证券梳理的华为盘古大模型产业链研报中指出,华为盘古大模型的优势在于人才储备和算力自主可控,有望成为国内领先的大模型,其生态产业链标的有望迎来加速发展,包括拓维信息、四川长虹、麒麟软件(中国软件)、统信软件(诚迈科技)、麒麟信安等华为生态公司。国盛证券则认为,华为盘古为首个多模态千亿级大模型,有望赋能百业。

 

 

 

 参考文章:消息称华为版 ChatGPT“盘古 Chat”7 月 7 日发布,面向 To B / G 政企端客户 - IT之家

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/16159.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

苹果上演“无间道”?故意泄露假消息“钓鱼”,成功抓获 iOS 17 内部爆料者...

整理 | 郑丽媛 出品 | CSDN(ID:CSDNnews) 在今年 3 月底,苹果预告了 WWDC23 大会的时间:北京时间 6 月 6 日至 10 日。据外媒预测,iOS 17、新款 MacBook Air 和 M3 芯片都有可能在本次大会中亮相。 然而对于…

被 Google 裁掉的 Golden 12K:开源开发者成重灾区,61 岁再求职!

整理 | 屠敏 出品 | CSDN(ID:CSDNnews) 2022 被视为全球经济的低谷期,如今 2023 新一年的到来,被众人赋予了很高的期望。 然而,新年伊始,全球科技巨头之一的 Google 最新宣布大规模裁员的消息&a…

简单聊聊工程质量中研发需要关心的点

一、背景 作为程序猿,工程质量是我们逃不开的一个话题,工程质量高带来的好处多多,我在写这篇文章的时候问了一下CHATGPT,就当娱乐一下,以下是ChatGPT的回答: 1、提高产品或服务的可靠性和稳定性。高质量的系…

ChatGPT不会很快接管人类工作,AI也不会免费打工

ChatGPT 等大模型的相继发布,让很多人倍感压力,害怕 AI 会很快接管他们的工作。对此,OpenAI 也曾发表过一项研究,表明 ChatGPT 的影响涵盖所有收入阶层,且高收入工作可能面临更大的风险。事实到底如何呢? …

AI辅助编程实践-Copilot

引言 在ChatGPT的浪潮下,当前大模型普遍引入了编程问题平台以及大量代码数据来训练逻辑和问答能力,同时大模型本身具备的自然语言理解和处理能力,使得我们可以与大模型进行代码编程上的交流与咨询,大大减少我们在一些琐碎事务上的…

chatgpt赋能python:Python动态调用方法:优雅的编程解决方案

Python动态调用方法:优雅的编程解决方案 Python语言的特性之一是其动态性。这意味着Python在运行时不仅能够创建新的对象和修改现有对象的属性,还可以动态地调用方法。这种能力在编写大规模的Python应用程序时格外有用。本文将深入探讨Python动态调用方…

聚观早报 | ChatGPT登顶美区iOS免费榜;库克不满苹果首款MR设备

今日要闻:ChatGPT登顶美区iOS免费榜;库克不满苹果首款MR设备;索尼正开发小尺寸折叠屏手机;万达辟谣大规模裁员;智能仿生手让截肢者重获手心的温度 ChatGPT登顶美区iOS免费榜 ChatGPT 在 iOS 美区免费 App 排行榜上位列…

【送书福利】终于有本书讲清了ChatGPT和AIGC

文末送书活动 AIGC的各大门派是谁?典型技术都有什么? AIGC为什么在绘画领域先破圈?ChatGPT的有哪些局限性? 为何科技企业争相推出大模型? 人类的创新能力会被AIGC取代吗…… 诸如此类的这些话题呈现爆发性增长&#xf…

【社区图书馆】人工智能新高度:生成式AI带来新的革命!

引言 很高兴能够参加CSDN & 机械工业出版社联合举办的深读计划活动,非常荣幸被选中获得纸质版的《你好,ChatGPT》这本书,在这里再次感谢CSDN、机械工业出版社给我的这个阅读机会,我个人也是非常珍惜这次深读计划,经…

终于有本书把ChatGPT和AIGC讲清了!

AIGC的各大门派是谁?典型技术都有什么? AIGC为什么在绘画领域先破圈?ChatGPT的有哪些局限性? 为何科技企业争相推出大模型? 人类的创新能力会被AIGC取代吗…… 诸如此类的这些话题呈现爆发性增长,频频被科技…

ATA笔记

目录 One Model to Serve ALL:多场景下的星型CTR预估模型STAR 解决问题 网络结构 Scenario-Specific FCN Scenario-Specific Linear Transformation Master & Auxiliary Network LinUCB介绍 Mix_Loss:稀疏高客单场景下成交Loss设计 GMSL: GRU-based Mu…

一文看尽SOTA生成式模型:9大类别21个模型全回顾!

来源:新智元 极市平台 本文约3800字,建议阅读5分钟本文总结了2022年发布的21个生成式模型,一次看明白生成式模型的发展脉络! 过去的两年时间里,AI界的大型生成模型发布呈井喷之势,尤其是Stable Diffusion开…

多模态大模型综述: LLaVA, MiniGPT4

文章目录 LLaVA一. 简介1.1. 摘要1.2. 引言 二. 相关工作三. 基于GPT辅助的视觉指令数据生成四. Visual Instruction Tuning4.1 网络结构4.2 训练 5 实验5.1 多模态聊天机器人5.2 ScienceQA MiniGPT4一. 简介1.1 Overview 二. 方法2.1 网络结构图2.2 第一阶段训练2.3 高质量对齐…

被称为下一代风口的AIGC到底是什么?

近期,短视频平台上“AI绘画”的概念爆火,ChatGPT这一词条也刷爆了科技圈,而这些概念同属于一个领域——AIGC。2022年12月,Science杂志发布的2022年度科学十大突破中,AIGC入选。 那么,被称之为是AI下一代风…

Postman如何设置成中文?(汉化)

1. 点击下方这个链接,进入gitee,在里面下载一个插件 Releases hlmd/Postman-cn GitHub 进入之后是这个样子的: 2.看一下自己的postman是什么版本的,然后在gitee下载对应的APP包(注意:是App.zit包。不要下…

强大的编辑器 Cursor,免费集成了 ChatGPT-4

AI 时代来临,还不会利用工具帮助你工作,很容易就会被淘汰了。 就在上一周是 AI,集体亮相的一周,ChatGPT-4、new-bing、文心一言、Claude 等等,一一体验过这些工具,能明显感觉到作为 CV 工程师的焦虑。 在…

刚刚!BingChat全面开放,人人可用!

大家好,我是鸟哥。 如题,微软真是下血本。昨天毫无征兆的宣布BingChat全面开放,人人可用!众所周知ChatGPT得使用门槛有多高,而BingChat底层调用的是GPT4.0的模型,这无疑是白嫖GPT4.0最简单的姿势了。鸟哥一…

使用Microsoft Edge dev浏览器突然找不到new bing,bing chat消失

bing chat在原本bing的主页但关闭后再次打开消失不见,请清除cookies并重新打开浏览器。 之前bing的时候找不到这种情况,可能是Mac的小bug吧,发个博客记录一下。 更新Mac系统后重新开机,再打开Microsoft edge dev的bing页面就是如…

英伟达4070Ti 6499元起/ 微软要推出ChatGPT版Bing/ 苹果头显被曝售价3000美元... 今日更多新鲜事在此...

日报君 发自 凹非寺量子位 | 公众号 QbitAI 大家好~今天是新年的第一个星期三——还有两天又到周末啦。 科技圈还有哪些有意思的事? 日报君在此呈上~ 微软要推出ChatGPT版Bing搜索 最近,OpenAI的聊天工具ChatGPT成了AI界顶流,不过它本身没有网…

前哈工大教授开发的ChatALL火了!可同时提问17个聊天模型,ChatGPT/Bing/Bard/文心/讯飞都OK...

丰色 发自 凹非寺量子位 | 公众号 QbitAI 今天的你,是否还在几个聊天大模型之间“反复横跳”? 毕竟各家训练数据和方法不尽相同,擅长和不擅长的东西也都不一样。 现在,不用这么麻烦了。 有人开发了一个名叫“ChatALL”的应用&…