华为参战!国产之光盘古大模型推:盘古Chat

盘古Chat是华为基于盘古大模型开发的一款多模态千亿级大模型产品,可以支持多种自然语言理解和生成的任务,如文本生成、问答、翻译、对话等。它是直接对标目前比较火爆的ChatGPT的产品,被认为是新一代的国产“AI”王炸。
盘古Chat

盘古Chat预计将于今年7月7日举行的华为云开发者大会(HDC.Cloud 2023)上对外发布以及内测,产品主要面向To B/G政企端客户。根据华为公布的一份论文数据显示,华为盘古PanGu-Σ大模型参数最多为1.085万亿,基于华为自研的MindSpore框架开发。整体来看,PanGu-Σ大模型在对话方面可能已接近GPT-3.5的水平。

盘古Chat是基于盘古大模型的一个应用场景,而盘古大模型则是由NLP大模型、CV大模型、多模态大模型、科学计算大模型等多个大模型构成,通过模型泛化,解决传统AI作坊式开发模式下不能解决的AI规模化、产业化难题。盘古大模型于2021年4月正式对外发布,后来又在2022年4月升级到2.0版本。目前,AI大模型中的NLP大模型、CV大模型以及科学计算大模型(气象大模型)均已被标记为即将上线状态。

盘古Chat的优势在于人才储备和算力自主可控,有望成为国内领先的大模型,其生态产业链标的有望迎来加速发展,包括拓维信息、四川长虹、麒麟软件(中国软件)、统信软件(诚迈科技)、麒麟信安等华为生态公司。

盘古大模型

盘古大模型是华为开发的一系列大规模自回归中文预训练语言模型,包括 NLP 大模型、CV 大模型、多模态大模型、科学计算大模型等。它们都是基于昇腾计算产业生态构建的,可以在不同的行业和场景中提供智能化的服务和解决方案。

其中,NLP 大模型是业界首个超千亿参数的中文预训练大模型,被认为是最接近人类中文理解能力的AI大模型。它首次使用Encoder-Decoder架构,兼顾NLP理解与生成的能力。在预训练阶段学习了超40TB文本数据,并通过行业数据的小样本调优,提升模型在场景中的应用性能。在权威的中文语言理解评测基准CLUE榜单中,盘古NLP大模型在总排行榜及分类、阅读理解单项均排名第一,刷新三项榜单世界历史纪录;总排行榜得分83.046(人类水平是85.61分),多项子任务得分业界领先。

CV 大模型是超过30亿参数的业界最大CV大模型,首次实现模型按需抽取,首次实现兼顾判别与生成能力。它可以基于模型大小和运行速度需求,自适应抽取不同规模模型,AI应用开发快速落地,使AI开发进入工业化模式。使用层次化语义对齐和语义调整算法,在浅层特征上获得了更好的可分离性,使小样本学习的能力获得了显著提升,达到业界第一。

多模态大模型具备图像和文本的跨模态理解、检索与生成能力。它可以根据不同的输入和输出类型,生成适合的内容和回复。例如,它可以根据一段文字生成一幅图像,或者根据一幅图像生成一段文字。

科学计算大模型主要解决各种科学问题,旨在用AI促进基础科学的发展。它可以用于物理、化学、生物等领域的研究和探索,例如气象预报、药物设计、材料发现等。

除了以上四个基础大模型(L0)以外,盘古大模型还包括 图网络(Graph)大模型 ,首创图网络融合技术,在工艺优化、时序预测、智能分析等场景有广泛应用。

盘古大模型不断进化,共分为L0、L1、L2三个层级。L0指基础大模型,L1指行业大模型,L2则是指面向更加细分场景的推理模型。目前,在 L1级别的行业大模型 方面,华为已经推出了盘古金融大模型、盘古矿山大模型、盘古气象大模型、盘古电力大模型、盘古制造质检大模型、盘古药物分子大模型等行业大模型。在 L2级细分场景模型 方面,华为已经推出,例如基于气象大模型的短临气象预报、台风预测等场景模型;例如基于电力大模型的无人机电力巡检、电力缺陷识别等场景模型;例如基于时尚大模型的时尚辅助设计、时尚版权保护等场景模型。此外,在物联网、智能座舱、智能驾驶等领域,华为都已推出基于盘古大模型的各种应用。

在 生态建设方面 ,华为盘古大模型是基于昇腾计算产业生态。关于AI生态型产业链,华为提出“一平台双驱动”的模式。其中“一平台”指基础软件平台,包括AI处理器、服务器硬件以及芯片使能软件、AI框架。“双驱动”指平台要支撑的两大生态,一是技术生态,二是商业生态,包括ISV(独立软件开发商)、IHV(独立硬件开发商)、整机、一体机合作伙伴等。

盘古大模型和GPT-3的差别

盘古大模型和GPT-3都是基于Transformer的大规模自回归预训练语言模型,都可以应用于多种自然语言理解和生成的任务,都具有强大的泛化能力和迁移能力。

但是,它们之间也有一些区别,主要体现在以下几个方面:

语言范围:盘古大模型主要应用于中文的文本生成、问答、翻译等任务。而GPT-3则可以应用于英文和其他语言的文本生成、翻译、自然语言推理、问题回答等任务。

数据来源:盘古大模型的训练数据来自于中文网络数据,包括维基百科、百度百科、新闻、论坛、社交媒体等,总共超过40TB。这种多样性的数据来源使得盘古模型拥有更广泛的知识和语言能力,对于中文应用来说具有很大的优势。

GPT-3的训练数据主要来自于英文网络数据,包括维基百科、谷歌书籍、新闻等,总共约45TB。
参数规模:盘古大模型有2000亿个参数,比 GPT-3 的1750亿稍高一点。参数规模越大,意味着模型可以学习到更多的信息和知识,也可以处理更复杂的任务。

架构设计:盘古大模型采用了Encoder-Decoder架构,兼顾了NLP理解与生成的能力。GPT-3则采用了Decoder-only架构,主要侧重于NLP生成的能力。Encoder-Decoder架构可以更好地处理输入和输出之间的对齐和映射关系,例如机器翻译、文本摘要等任务。

训练方式:盘古大模型在预训练阶段使用了多任务学习的方式,将不同的下游任务转化为语言模型的训练目标,例如机器翻译、阅读理解、文本分类等。这样可以使得模型在不同任务上共享知识和特征,提高泛化能力和迁移能力。

GPT-3则在预训练阶段只使用了单任务学习的方式,即自回归语言建模。

信息源:

(1) 一文看懂:华为盘古系列AI大模型到底是个啥?(附:盘古发布会观看地址) – 知乎. https://zhuanlan.zhihu.com/p/619518908.

(2) 大语言模型汇总(ChatGPT、盘古、通义、文心一言、混元)AI_Frank的博客-CSDN博客. https://blog.csdn.net/qq_30653631/article/details/130049481. (3) 华为加入大模型军备竞赛,“盘古Chat”将于7月发布药物行业分子. https://www.sohu.com/a/682291393_161795.

(4) 盘古大模型和GPT 专家交流 思考 – 知乎 – 知乎专栏. https://zhuanlan.zhihu.com/p/617572386.

(5) 华为云提出盘古气象大模型:中长期气象预报精度首次超过传统数值方法,速度提升10000倍以上 – 知乎. https://zhuanlan.zhihu.com/p/582285853.

(6) HUAWEI4月8号发布中国版chatGPT盘古大模型 – 知乎 – 知乎专栏. https://zhuanlan.zhihu.com/p/619325773.

(7) 拆解华为盘古大模型:与 ChatGPT 有何不同? – 知乎专栏. https://zhuanlan.zhihu.com/p/620559828.

(8) GPT综述-各模型之间的对比 – 知乎 – 知乎专栏. https://zhuanlan.zhihu.com/p/450074465.

(9) 大语言模型汇总(ChatGPT、盘古、通义、文心一言、混元)_AI_Frank的博客-CSDN博客. https://blog.csdn.net/qq_30653631/article/details/130049481.

(10) 消息称华为版ChatGPT“盘古 Chat”7月7日发布,面向To B/G政企端客户TechWeb. http://www.techweb.com.cn/it/2023-06-04/2928151.shtml.

(11) 消息称华为版 ChatGPT“盘古 Chat”7 月 7 日发布,面向 To B / G 政企端客户 – IT之家. https://www.ithome.com/0/697/519.htm.

(12) 好消息!华为自研ChatGPT将于7月7日发布 命名盘古Chat直接对标ChatGPT模型训练芯片. https://www.sohu.com/a/682076882_120930098.

(13) 华为版ChatGPT要来了!盘古Chat被视为新一代国产“AI”王炸. https://www.163.com/dy/article/I6FL90AN0519DG1H.html.

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/8860.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

华为云发布代码检查服务;微软向其美国雇员提供“无限制”休假时间;付费版 ChatGPT|极客头条...

「极客头条」—— 技术人员的新闻圈! CSDN 的读者朋友们早上好哇,「极客头条」来啦,快来看今天都有哪些值得我们技术人关注的重要新闻吧。 整理 | 梦依丹 出品 | CSDN(ID:CSDNnews) 一分钟速览新闻点&#…

大模型多模态Chatgpt+自动驾驶控制器设计方案

/导读/ 最近的科技圈,大家都被微软推出的ChatGPT刷屏,作为工智能公司OpenAI于2022年11月推出的聊天机器人,其能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,甚至能完成撰写邮件、视频脚本、文…

ChatGPT三问:是什么、从哪来、去往哪?

©PaperWeekly 原创 作者 | 张燚钧 单位 | 中国移动云能力中心 研究方向 | 预训练大模型 ChatGPT 热潮已经持续月余,目前热度依然不减。根据最新的消息,ChatGPT 的升级版 GPT-4 也已蓄势待发。回首 ChatGPT 的这波热潮,ChatGPT 是什么&a…

基于单机最高能效270亿参数GPT模型的文本生成与理解

作者:李鹏,王玮,陈嘉乐,黄松芳,黄俊 单位:阿里云智能机器学习平台PAI & 达摩院自然语言基础技术 概述 GPT模型能较好的处理文本生成领域的各种任务,比如文本补全,自由问答&am…

ChatGPT的因果关系基础:数据科学的实践与发展!

数据会说谎?如何正确的挖掘并使用数据? 前沿的科学实验如何做? 实验又是如何欺骗你的? ChatGPT等AIGC技术如何与因果学习双向赋能? 数据中台如何发挥功效? 用户增长有捷径吗? 数据科学的最佳实践…

最新ChatGPT商用网站源码+支持ai绘画+GPT4.0+GPT3.5+Prompt角色+实时语音识别输入+后台一键版本更新!

程序已支持ChatGPT4.0、Midjourney绘画、GPT3.5 API绘画、新增绘画广场功能、Prompt面具角色扮演功能,后台自定义添加,用户也可自定义添加实时语音识别输入、用户会员套餐、用户每日签到功能、后台管理、一键更新版本。支持手机电脑不同布局页面自适应。…

2023最新ChatGPT商业运营网站源码+支持ChatGPT4.0+新增GPT联网功能+支持ai绘画+实时语音识别输入+用户会员套餐+免费更新版本

2023最新ChatGPT商业运营网站源码支持ChatGPT4.0新增GPT联网功能支持ai绘画实时语音识别输入用户会员套餐免费更新版本 一、AI创作系统二、系统程序下载三、系统介绍四、安装教程五、主要功能展示六、更新日志 一、AI创作系统 提问:程序已经支持GPT3.5、GPT4.0接口…

Mantis系列:MantisBT 注册新用户时设置密码

修改\xampp\htdocs\mantis\config_defaults_inc.php配置文件 找到 $g_send_reset_password 修改前:$g_send_reset_password ON; 修改后: $g_send_reset_password OFF;

使用Foxmail 登录qq邮箱使用第三发授权码登录失败

上午通过 mac 来登录qq邮箱本来很简单的,账户授权码就可以了,但是总是登录不上去,这里来总结一下 客户端Foxmail 这里填写一个授权码就可以了,剧情的授权码到自己的qq邮箱 中获取: QQ邮箱->设置->账户-> 前…

常见邮件发送失败原因分析以及解决方法

本文来自:http://www.maikongjian.com/style/info/shownews2.asp?id439 一.发到 sina.com 的邮件会被退回 我发到 sina 的邮件会被退回,并提示"remote server said: 553 Spam Mail http://mail.sina.com.cn/FAQ.html";错误,怎么…

TP6验证码的使用和验证失败的原因以及解决办法

首先使用Composer安装think-captcha扩展包&#xff1a; composer require topthink/think-captcha项目根目录下 在模版内添加验证码的显示代码 <div>{:captcha_img()}</div>或者 <div><img src"{:captcha_src()}" alt"captcha" /&…

java程序通过腾讯邮箱发送邮件失败:javax.mail.AuthenticationFailedException: 535 Error: authentication failed, syste

1.问题描述 通过java程序实现邮箱发送验证码的功能使用一段时间后出现发送邮件失败的问题排查后提示&#xff1a;javax.mail.AuthenticationFailedException: 535 Error: authentication failed, syste完整日志 DEBUG: setDebug: JavaMail version 1.4.7 DEBUG: getProvider(…

登陆163邮箱显示服务器验证失败是什么原因?微信怎么登陆邮箱?

周末休息的时候呆在家里&#xff0c;突然收到老板打来的电话&#xff0c;说有一封紧急邮件要马上回复。于是急急忙忙打开电脑登录企业邮箱&#xff0c;却发现登录邮箱时显示服务器验证失败&#xff0c;这是怎么回事呢&#xff1f;有没有其他电子邮箱入口来登录邮箱&#xff1f;…

第三方客户端登录QQ邮箱遇到“无法验证账户名或密码”问题解决

由于好久没有再登录QQ邮箱了&#xff0c;今天使用MBP的mail客户端登录了下&#xff0c;竟然一直出现无法验证账户名或密码的问题&#xff0c;很是纳闷呀。。。以图为证? 解决步骤&#xff1a; 登录qq邮箱https://mail.qq.com/cgi-bin/frame_html 开启IMAP/SMTP服务 在打开过…

Foxmail 添加QQ邮箱失败 提示密码错误

今天使用Foxmail的时候一直弹出密码错误提示框&#xff0c;输入QQ密码和邮箱独立密码都不行。上网查资料得以解决&#xff0c;在此记录下以备之后再次遇到这个问题。 首先查看邮箱的POP3/SMTP服务是否开启 在网页端登录QQ&#xff0c;在 设置 -> 账户 -> POP3/IMAP/SMTP…

QQ邮箱第三方密码验证失败解决方法

日常学习中&#xff0c;使用第三方邮箱进行接受邮件很常用&#xff0c;但是有时候更改了QQ的密码之后&#xff0c;就会出现重新验证&#xff0c;每次都搞了一大会&#xff0c;而且还很麻烦&#xff0c;感觉很智障&#xff0c;下面我来告诉大家快捷的方法&#xff0c;比起百度那…

imap账号验证失败

在使用第三方客户端登录qq邮箱比如网易邮箱&#xff0c;有时出现imap账号验证失败时&#xff0c;此时可以通过以下方式解决&#xff1a; 1. 首先登录qq邮箱&#xff0c;进入账号设置页面 2. 开启下面所示的服务 3. 此时会要求你输入qq安全中心显示的6位数动态密码 4. 打开qq安…

从 AI 绘画到 ChatGPT,聊聊生成式 AI

我们小时候经常有幻想&#xff0c;未来不用再去上班了&#xff0c;在工厂工作的都是机器人。在家也不用打扫卫生&#xff0c;机器人可以包揽一切。不知不觉间&#xff0c;我们小时候的幻想已经慢慢变成现实&#xff0c;工厂里有了多种型号的机械臂&#xff0c;代替了部分流水线…

论文投稿查重

这里写自定义目录标题 欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题&#xff0c;有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants 创建一个自定义列表如何创建一个…

论文查重原理及实现

论文查重原理及实现 原理: 在知网上的论文检测为整篇的进行上传但是本人却是提交自己的正式论文部分上去的(paperpass), 上传的文章格式对检测结果可能会造成影响(在paperpass上存在两种类型(分别为.doc, .docx), 但有的还可以是.txt文件), 此影响为几十个字的小段可能检测不…