专家解惑 | 关于华为云盘古大模型,你想问的都在这里~

本文分享自华为云社区《专家解惑 | 关于华为云盘古大模型,你想问的都在这里~》,原文作者:HWCloudAI。

4月25日,华为云发布盘古系列超大规模预训练模型,包括30亿参数的全球最大视觉(CV)预训练模型,以及与循环智能、鹏城实验室联合开发的千亿参数、40TB训练数据的全球最大中文语言(NLP)预训练模型。

其中,盘古NLP大模型由华为云、循环智能和鹏城实验室联合开发,具备领先的语言理解和模型生成能力:在权威的中文语言理解评测基准CLUE榜单中,盘古NLP大模型在总排行榜及分类、阅读理解单项均排名第一,刷新三项榜单世界历史纪录;总排行榜得分83.046,多项子任务得分业界领先, 向人类水平(85.61)迈进了一大步。

外界对盘古大模型充满了好奇,在华为开发者大会(Cloud)期间,参与大模型开发的两位华为云专家回答了以下几个大家关心的问题。

谢凌曦博士专访

Q:作为一个开发者,请问这些预训练模型的易用性如何?使用成本有多高?

谢凌曦:预训练模型设计的目的就是为了让大家降低使用成本。模型的预训练过程,成本是比较高的,但这个成本不需要开发者来承担。而在使用这些大模型的时候,它本身的易用性会使得使用成本进一步降低,达到一个比较合适的水平。比如说,我们会开发出一些比较通俗易懂的Pipeline,如果你是有一定基础的开发人员,你可以从我们的Pipeline当中去做更多的定制化的开发,更好地去释放我们预训练模型的能力。如果你只是一个AI开发小白,想用大模型去做AI简单的开发,我们也会给你更加通俗易懂的界面,让大家能够用一些拖拉拽的方式使用盘古大模型。总体来讲,大家在使用预训练模型的时候,计算时长、调参所需要重复的代价等都会被降到很低,总体来讲是对开发者非常友好的。

Q:对于新入门计算机视觉的人来说,需要掌握什么哪些知识才能快速进入到学习和研发中?

谢凌曦:人工智能、计算机视觉,经过几十年的发展,到现在已经拥有很庞大的知识体系。如果一个初学者想要把这些东西都了解以后再开始做研究,效率会稍微有点低。我给大家的建议是,你在学习过程当中,可以先找准一个问题。刚开始的时候,这个问题可能是相对初级的问题,但一定有具体的场景。比如想做弱监督学习,一般就是遇到某个实际的问题,它确实需要弱监督算法。但是这个时候我是不是一定要掌握全监督才能去做弱监督呢?并不是这样的。你可以先去查阅一些资料,了解当前的弱监督学习方法,它的基线是什么,它的前沿在哪里。然后你就可以开始做一些简单的实验。实验的过程当中,一般会遇到一些困难或者一些疑惑。解决这些困难和疑惑的过程,一般就会把你引导到它的基础,比如说全监督到底是怎么做的。当你有了更多基础以后,回过头来,也会发现你对当前做的算法有了一个更好的理解。

所以我的建议是大家可以找一本机器学习、计算机视觉这类介绍比较深入的教材去看。但是不要局限于这个教材:一边做具体的课题,一边去学习知识,效率会比较高。

张晓鹏博士专访

Q:盘古CV大模型有哪些成功的落地?跟业界相比处在什么位置?

张晓鹏:视觉预训练CV大模型,结合相关流程化开发,已经在华为内部以及其他合作项目上,有100+成功落地,这些方向涵盖了各行各业,包括工业视觉、网络审查、零售商超,以及医疗等场景,都获得了一些相较于之前不使用预训练大模型更高的结果。在某些场景上,比如刚才提到的遥感影像分割,我们通过设计针对遥感影像的预训练算法,在没有增加额外标注代价的情况下,达到了最多12%的分割精度提升。还有另外一个比较有意思的现象,我们使用超大规模图像进行的预训练模型具有更好的可迁移性,即直接把这样一个模型,迁移到了工业质检的缺陷上进行推理,我们非常欣喜地发现,我们在下游数据集上没有进行任何微调,但是在工业缺陷检测上,获得了比之前我的模型不停地高度的优化,甚至利用下游的数据微调更好的结果,这个结果基本上会高出3到4个百分点。这个启发我们,模型数据一旦够多,其实它的泛化能力能够获得更好的保障。

第二,我们是国内最早做视觉预训练大模型的公司之一。在国外是Facebook和谷歌从2019年开始在图像上做了一些应用。我们视觉预训练模型大概从2019年底的时候就开始了,通过自研的一些列改进算法,我们首次在基于imagNet 的无监督预训练模型线性分类精度上达到了全监督基线的水平,同时在小样本学习上大大领先现有技术,这些都是业界领先的成果。

Q: 华为的预训练是采用什么类型数据和学习任务?大模型如何保证端侧性能?

张晓鹏:针对视觉图像不同角度,以及不同场景的变化,我们采取的方法非常简单。一,我们可能有海量数据集,这个数据集规模已经达到了亿级甚至十亿级这样的规模,我们相信这个海量的数据集,它能够建模,我们实际场景图像的方方面面。另外一个,我们采取了什么样的学习方式。其实它的一个核心思想,就是2019年开始,比较火的基于全局的对比度自监督学习方法。

当然我们在这上面做了很多改进。包括如何来利用弱标签信息,如何把全局的信息拓展到局部来更好建模局部相关关系。同时也会呼应刚才提到的,如何处理不同视角,不同尺度图像问题,怎么来让它进行高效的建模,这里面就是让它进行不同的数据增强,我们在预训练算法里面,集成了十余种数据增强方法,让它通过不同的数据增强,使得整个模型具有针对不同数据增强的不变性。

到目前为止,我们在一个大模型,搭载模型蒸馏、抽取以及行业大模型,我们现在已经适配了大概十余种预训练模型。而这十余种模型都是通过我们一个大模型的抽取,蒸馏所得到的,它在相应的行业上,得到了非常大的精度提升。同时也极大的减少了标注代价以及模型迭代周期。

Q:华为的预训练模型是如何结合不同行业知识,解决标注数据大的问题?

张晓鹏:举一个我们在HDC Cloud上发布的国网电力智能巡检的例子,这就是非常典型的利用盘古CV大模型解决行业知识。

在国网电力巡检模型开发的过程中,它有海量的数据,标注非常困难,我们做了什么呢?通过我们的视觉预训练算法,在海量的巡检数据上进行预训练,这个预训练是利用了无人机巡检的数十TB,上百万规模的数量,进行预训练,它的预训练可以看到我们非常多的数据,它的内在分布。我们的大模型,模型参数越大,也看了更多的数据,所以说它能够更好的建模无人机巡检过程中的图片的细微差异。

利用我们的视觉预训练大模型,它能够提供更好的表征以后,因为它的缺陷和正常样本的表征能力更强,我们在标注代价上,基本上减少了80%以上,这一块整个在人力上是一个非常大的提升。除了减少标注,我们一个模型可以适配我们电力行业一百多种缺陷,从而让模型迭代周期大大减少,整个迭代效率大概提升了10倍,我们在每次迭代过程中反馈给人需要标注的整体的工作量就会越少,通过这两种模式,我们实现了在电力行业方面,利用我们视觉预训练模型,极大的提升了我们的开发效率。

 

点击关注,第一时间了解华为云新鲜技术~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/34053.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

探秘华为云盘古大模型:AI for industries的身体力行

摘要:大模型是新一轮AI发展的核心,其已在推进产业智能化升级中已表现出巨大潜力,并将在未来三年里形成风起云涌之势。 本文分享自华为云社区《探秘华为云盘古大模型:AI for industries的身体力行》,作者:华…

聚观早报 |腾讯Q1营收重回两位数增长;特斯拉向印度政府提议建厂

今日要闻:腾讯Q1营收重回两位数增长;传特斯拉向印度政府提议建厂;ChatGPT创始人呼吁加强对AI监管;笑果被罚款1335万;药明康德联合创始人赵宁去世 腾讯Q1营收重回两位数增长 5 月 17 日,腾讯控股发布 2023 …

向量数据库是如何工作的?

点击上方“芋道源码”,选择“设为星标” 管她前浪,还是后浪? 能浪的浪,才是好浪! 每天 10:33 更新文章,每天掉亿点点头发... 源码精品专栏 原创 | Java 2021 超神之路,很肝~中文详细注释的开源…

“危险!立刻停下所有大型AI研究!”马斯克领衔,1000多名硅谷企业家科学家联名呼吁...

看见更大的世界 打开App APP内打开 华尔街见闻 原创1个小时前 华尔街见闻官方账号 优质财经领域创作者 关注 当全社会都在为AI的进化而欢呼雀跃,全新的、意想不到的风险可能也正在悄悄酝酿。 3月22日,生命未来研究所(Future of Life&#xf…

OpenAI将用新方法来训练模型;英伟达CEO拟本月会见腾讯、字节跳动等企业高管;摩根大通正寻求雇佣更多AI员工丨每日大事件...

‍ ‍数据智能产业创新服务媒体 ——聚焦数智 改变商业 企业动态 176比特“祖冲之号”量子计算云平台上线 5月31日,在中科院量子信息与量子科技创新研究院的指导下,在中科院软件所和中电科十六所的技术支持下,科大国盾量子技术股份有限公司携…

OpenAI CEO 在美国国会首秀:回应对 AI 的一切质疑,主动要求接受监管!

整理 | 屠敏 出品 | CSDN(ID:CSDNnews) 从最初只有十来个人的小团队,到如今的 300 人;从起步拿到 10 亿美元启动资金,到创造了估值约为 300 亿美元的 AI 独角兽“神话”,OpenAI 用 GPT 系列、Wh…

LaTeX常用符号及希腊字母

LaTeX常用符号及希腊字母 在LaTeX代码加载包的地方添加 \usepackage{amsmath} LaTeX符号代码效果\rightarrow{}→\leftarrow{}←\xleftarrow[下方公式]{上方公式}\xrightarrow[下方公式]{上方公式}Eg:A \xleftarrow[n]{x>0} B\emptyset∅\in∈\notin∉\subset⊂\supset⊃\…

如何最大限度地利用ChatGPT、Bard和其他聊天机器人

随着生成式人工智能的发展,面向消费者的聊天机器人能够处理不同领域的需求,并提供相应的帮助和建议,如制定商业战略、设计数学学习指南、提供薪资谈判建议,甚至撰写婚礼誓词。而且这只是一个开始。 原文链接:https://w…

你是不是想做影视剪辑奈何不会写文案?我来帮你搞定文案

影视剪辑的本质就是我们进行一系列的主题动作分解组合,完成蒙太奇形象的塑造,影视剪辑主要分为几个步骤: 第一:视频素材准备 第二:文案素材准备 第三:确定剪辑方案 第四:剪辑手段选择 第五&…

电影解说文案怎么写,电影解说文案写作技巧,影视解说新手该怎么写文案

电影解说文案既是文字表达,也是艺术表达。在现代,越来越多的影片制作者不仅要拍出精彩视觉效果的电影,还要拍出让观众深深触动的影片。因此,电影解说文案的写作要求也越来越高。那么,如何写出吸引人的电影解说文案&…

电影解说文案写作技巧

电影解说文案是指在电影放映期间,为了让观众更好地理解电影情节、人物、背景和细节,配以文字解说的一种形式。好的电影解说文案可以让观众更好地理解电影,加深观影体验。下面是一些电影解说文案写作技巧,希望能对您有所帮助。 一、…

Word 2016:您正试图运行的函数包含有宏或需要宏语言支持的内容

新建一个word文档后,发现打开时有以下提示: 需要多点几次才能消去,比较烦人 解决方案: 1、以管理员身份运行Word(在office安装目录下找WINWORD.EXE,或者在开始菜单中右键均可); 2…

word编写宏

1,首先开启宏 2,视图->查看宏 3,创建宏 AutoOpen()函数为打开word自动运行4,保存即可

三步教你Word启用所有宏

此博客为个人博客,不涉及商业用途,仅提供学习参考,内容均来自个人原创以及互联网转载和摘录。 此博客上带有原创标识的文章、图片、文件等,未经本人允许,不得用于商业用途以及传统媒体。网络媒体或个人转载请注明出处…

WORD文档中的宏代码操作(表格批量操作)

编写word宏代码步骤 点击“视图” - “宏” 。 点击“录制宏”,填写宏名称(即函数名),选择保存位置,确定后,鼠标会变成录像带,再进行需要的操作后,点击停止录制,即完成操…

微软word提示:您正试图运行的函数包含有宏或需要宏语言支持的内容

关闭Word提示:您正试图运行的函数包含有宏或需要宏语言支持的内容。而在安装此软件时,您(或您的管理员)选择了不安装宏或控件的支持功能。 解决方法 点击【开始菜单】—选择【控制面板】—找到并打开【程序和功能】(xp的是添加删除)—在里面找到安装好的…

word如何编写宏

1,首先开启宏 2,视图->查看宏 3,创建宏 AutoOpen()函数为打开word自动运行1 4,保存即可 5.然后我们把word关闭,重新打开,结果弹框: 这里注意一点: 只要打开word就会弹框&…

使用宏批量插入图片到Word表格

使用宏批量插入图片到Word表格 创建宏,word 视图-》宏》查看宏》输入名称》创建 宏代码如下: Sub imgTbl()If ActiveDocument.Tables.Count 1 Then 删除上次数据ActiveDocument.Tables(1).DeleteEnd If//获取文件夹,存入数组Dim kr()Set f…

解决插件在word中的宏禁用问题。MathType, Microsoft Office, powerpoint

背景:破解版的Microsoft Office,以及破解版的MathType。启动word后,会出现“宏禁用”的警告,并且MathType插件不可用,MathType对象也无法编辑,需要手动点击警告里的“启用”,主要是每次打开MS都得重新启用。…

打开word出现“您正试图运行的函数包含有宏或需要宏语言支持的内容。”的解决方法

1、Word选项→加载bai项→管理→转到……,转到→把勾勾都取消→确定即可。 2、工具→宏->安全性→可靠发行商,将下方的选择框中的钩清空,再将宏安全性改为最高。 3、可能是初次安装Office时共享里的VBA没安装,可以重新再安装一…