爆发前夜!华为阿里版ChatGPT!

本文经授权转载自微信公众号:51CTO技术栈,作者 | 徐杰承,审校 | 云昭

“你训练的大模型涌现了吗?”“还没有。好难受。”一时间成为了最近AI赛道玩家的一个爆热梗。

不管承不承认,相信每个玩家都不愿意输掉这场激烈的竞争。自百度成为国内“第一个吃螃蟹的人”后,又有两大中国科技巨头做好了准备——华为和阿里巴巴各自新研发的“大模型”、“ChatGPT”,也都即将于近日问世。

首先是华为的盘古大模型新版本即将亮相的消息!据称,4月8日,华为云人工智能首席科学家田奇,将在杭州人工智能大模型技术高峰论坛上,通过一场技术分享介绍“盘古大模型的进展及其应用”。

与此同时,一封来自阿里的会议邀请函也给业内带来了很有分量的消息:在4月11日的阿里云峰会上,将正式推出阿里最新自研的大模型,模型内测目前已在进行中,且接下来还会有各类行业应用类模型问世。就在今天中午,通义大模型已经官宣开始企业邀测!

b597e7c62e670f6cee0273b6bd44deee.jpeg

来源:阿里云公众号

如果说之前巨头们从“大炼模型”到“炼大模型”是在秀肌肉、打地基,那么这次发布模型的意义,则更多的在于入局类ChatGPT产品赛道!

华为:深耕B端,开辟多业务场景

事实上,华为自2020年便启动了AI大模型布局。据相关资料显示,盘古NLP大模型采用深度学习和自然语言处理技术,采用了大量中文语料库进行训练,基于“预训练+下游微调”的工业化AI开发模式,拥有超千亿参数,并支持多种自然语言处理任务,包括文本生成、文本分类、系统问答等。

f2b05f4d61d95d53e95691a10bd31053.png

华为版ChatGPT:接近GPT3.5水平,注重中文优化

根据华为云官方显示,华为即将上线的“盘古系列AI大模型”分别为NLP大模型(对标ChatGPT)、CV大模型、多模态大模型与科学计算大模型。据介绍,其中NLP大模型在预训练阶段学习了超40TB中文文本数据;CV大模型首次实现兼顾图像判别与生成能力;而科学计算大模型则可应用于气象、生物医药等领域。

f8a4c8792af4eff21129ee7b2e653064.png

来源:网络

与ChatGPT相比,盘古NLP大模型在数据方面更接近GPT3.5的水平,但其更加注重中文语言优化,在中文语法语义理解上有着更大优势,并且其拥有泛化能力强、小样本学习和模型高精度三大特性,可适用大量复杂的行业场景,即使少量样本也能达到高精度。

根据华为官方介绍,盘古NLP大模型在总排行榜及分类、阅读理解单项均排名第一,刷新三项榜单世界历史纪录,总排行榜得分83.046,多项子任务得分业界领先,是目前最接近人类理解水平 (85.61)的预训练模型之一。

d953f3d264a14f664a619cb6bd8c9313.png

华为的三个独特优势

大模型研发方面,华为相比于其他国内企业有着一项较为独特的优势——拥有完整的产业链和较强的算力匹配能力。据介绍,盘古系列大模型都是基于华为Model Arts所构建的,并由在2022年蝉联全球人工智能算力第一的鹏城云脑二期提供算力底座。在训练盘古大模型时,华为团队调用了超过2000块昇腾910芯片,进行了超过2个月的训练。

产业生态层面,华为则延续了自己重B端的企业基因,大模型产业化的初衷正是在于开辟更多B端业务场景,正如华为云人工智能首席科学家田奇所言,“将工业化的一面放置在更高的优先级上”。此外,盘古大模型还融入了华为在5G、云计算、物联网等领域的技术优势,可应用于智能客服、机器翻译、语音识别等多个领域,为企业提供智能化服务。

据中信建投研究报告显示,目前盘古预训练大模型能力已在包括能源、零售、金融、工业等领域得到验证。同时盘古NLP大模型通过迁移学习实现少样本学习目标,并采用了分布式计算技术,可以实现模型的在线训练和增量学习,随着数据量的增加不断优化模型,提高模型的准确度和质量,使其更加适合复杂的商用场景,在部分应用中的表现已超过GPT-3.5。

阿里:C端发力,测评结果喜人

再来看阿里这边,无独有偶,阿里的中文大模型研发之路也始于2020年左右。2021年,阿里先后发布国内首个超百亿参数的多模态大模型“通义-M6”以及号称“中文版GPT-3”的语言模型PLUG。虽然参数量仅为270亿,但PLUG与GPT-3一样拥有强大的文本生成能力。

8526a4f3745bf55b57257c7caa21f976.png

通义大模型融合升级

据报道显示,即将发布的阿里达摩院版ChatGPT,正是基于通义大模型体系融合升级而成。通义大模型底座基于统一学习范式OFA等底层技术打造,在不引入新增结构的情况下即可同时处理文生文、文生图、图片描述、内容摘要等多项单模态和多模态任务。经历升级后,更是可以处理超过包括语音和动作在内的多种跨模态任务。

其中“通义-M6”主要解决文本图像生成构建的相关任务,包括图文理解、图文生成、语音理解、语音生成,且阿里2021年发布的模型版本已达千亿参数;而通义-AliceMind则为NLP预训练模型,应用场景包括文生文、文本理解、问答对话等;通义-视觉应用场景则涵盖视频表征、图像检测、视频编辑等。

bc83639dd27997f2142c1e75ad478c8a.png

阿里内部爆料

在此前一份有关阿里大模型的采访中,阿里内部人员表示:阿里在大模型方面可以提供的方案主要有两种,一是阿里内部推出的模型效果相对较好,可以与集团内部广泛的C端产品进行结合,例如天猫、淘宝和高德地图的搜索业务,这将为搜索引擎带来全新的商业模式,也将为阿里本就蓬勃的C端业务注入更多活力,而C端的数据积累,也将很好地反哺阿里大模型及相关应用的研发。此外,阿里还可以输出自己的API,并向合作伙伴或渠道商收费。对于API,可能会在特定领域上对合作伙伴有所帮助,例如电商、搜索推荐等。

而在算力方面,阿里云在云上至少有上万片A100,整体至少能够达到10万片,集团的话应该会是阿里云5倍的量级。达摩院、天猫、淘宝的算力资源都是集团内资源使用。由于大模型及衍生应用研发等需求,阿里云今年增速会达到30-50%,个别客户会有复现GPT的需求,提出大规模AI算力需求,阿里将以云的方式进行支持。

除此之外,还有爆料显示,阿里即将推出的类ChatGPT对话机器人产品还可能将与钉钉生产力工具进行结合,后续也得到阿里巴巴方面确认。

c0dc7b6e550d6db57981512d1c988512.png

B站博主测评:结果喜人

更值得注意的是,就在近几天,有B站博主测试了阿里的天猫精灵,发现其已经上线了阿里版ChatGPT的语音助手。对此阿里也进行了回应,表示目前天猫精灵所整合的是大模型技术Demo,“天猫精灵和达摩院一直在紧密合作,其中包括推进大语言模型、声学模型、语音AI等综合应用”。

7ec2497362e1781ce35fb1fdbfd5923e.png

来源:网络

在B站博主所发布的测评视频中,博主与集成Demo版大模型的天猫精灵进行了超过3分钟的15轮问答对话,其中10问题的回复都明显优于国内已公布的同类型产品。且在了解到用户订餐需求后,天猫精灵同意了用户请求并表示已帮助用户完成了订餐。虽然由于并为集成相应接口,Demo版天猫精灵并没有如它所言完成任务,但相信在正式版发布后,诸如订餐、打车、购票等功能均可能得到实现。

专家热评

华为生态布局扎实

阿里数据和算力更优

那么,业内专家对于阿里和华为即将发布的大模型又有哪些评价和看法呢?为此,51CTO采访到了人工智能技术专家、前智源研究院政务创新中心技术负责人刘占亮老师。

据刘占亮分析,华为在该方面的最主要优势是:华为在toB领域的长期积累使其拥有着非常扎实的产业生态,而华为在人工智能方面的全栈布局将有助于企业在各领域、各不同业务中的长期发展。但从短期角度来看,华为大模型的商业化进展将有可能会受到底层基础设施成熟度的影响。

对于阿里而言,其拥有着覆盖多个行业的生态体系,大量C端以及B端的数据积累将为阿里大模型研发提供非常重要的动力,而在算力方面,阿里相比于大部分科技企业而言也有着巨大的优势。在数据和算力优势的加持之下,阿里在大模型研发及生产应用方面的效率应该能够达到较高水平。

虽然从应用领域与目标用户的角度来看,华为和阿里两家企业可能会有所不同。但归根结底,两家公司都有潜力推动中国人工智能领域发展。

但在此之前,刘占亮还指出,摆在这两位巨头眼前的还有三大主要挑战,其一是需要应对国内外激烈的市场竞争;其二是需要对潜在的政治风险做到0失误的精准控制;其三则是老生常谈的技术挑战,无论华为还是阿里,在自身业务层面都有着非常丰富的经验积累,那么其所研发的大模型及一系列衍生产品能否在实际生产中发挥更高的效率,这考验的便是企业对于特定领域技术的应用与理解

国产化ChatGPT才是出路

近期以来,ChatGPT陷入了一些列纷争之中,由于非法收集用户数据的原因,意大利已进行了对ChatGPT的全面禁封,德国也出于对数据保护的考虑,正在计划在全国范围内禁止ChatGPT的使用。而在不久前,ChatGPT也针对亚洲地区进行了一次悄无声息的大规模封号。就以上事件看来,依靠ChatGPT,微软与OpenAI已经成为事实上的头号玩家,而这对于国内企业类似产品的发展而言,不管是封禁还是封号,都并不是一个良好的势头。

诚然,由于中文天然的复杂性,实现中文版ChatGPT的难度将会变得更大,但国内科技企业能够在这一时期,利用自身优势研发针对不同业务场景的同类型模型及应用,无论是出于对自身利益的考量还是出于对更高理想的追求,这本身都是一件值得鼓励的事情。人工智能的发展在带来科技革命的同时,也注定会带来同一赛道上的百家争鸣,不管是企业层面,还是全球层面,都避无可避。

写在最后

如今,ChatGPT成为下一代操作系统的“叙事”刚刚开始,其所带来的强大的生产力提升必将赋能千行百业,并带来巨大的商业机会。在这样的情况下,自主可控与合理监管才是每个国家、每家科技企业甚至每位技术从业者应该关注与思考的问题。

虽然就目前而言,无论百度、华为、阿里还是其他正在深耕该领域的科技企业,都暂时无法推出能与GPT-4一较高下的AI大模型。但有时后发未必一定是坏事,让我们给予它们一些信心与时间,相信在这些企业与技术从业者的不断努力下,国内AIGC生态建设自主化的步伐将能够越走越快。

参考链接:

https://www.ithome.com/0/684/394.htm

https://www.zhihu.com/question/456443707/answer/1894670995

https://baijiahao.baidu.com/s?id=1762214043619898211

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/6010.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Osbypass苹果手机激活锁停用Hello密码锁绕ID屏幕锁密码支持三网(移动、联通、电信)国行版手机解锁打电话4G等支持打电话、短信、4G上网、重启、通知、iCloud登录

Osbypass是一款来自国外开发者的软件。界面简单,操作容易的工具,它可以帮助绕过忘记ID密码的设备,支持iPhone、iPad等。 整个工具界面是中文的,非常友好的操作界面。 MEID三网支持iPhone/iPad,完美重启、ID登录、推送…

最新IPAD协议登陆教程(扫码登陆)/62登陆后续更新

调用“获取登陆二维码”配置相关代理(代理可以通过巨量IP中按量付费测试,充值个10块钱无限用 ) 第一步、获取你要登陆的微信号常用地的代理(如图) 配置跟图片配置一样就行(代理类型务必选择socks),只需要修改你获取代理的地区就好了,然后点击生成api链接; 然后直接…

ipad忘记锁屏密码用计算机解决,4种无需密码即可解锁iPad的方法

第1部分:如何使用dr.fone解锁没有密码的iPad? 通过dr.fone - Unlock(iOS)可以帮助你解锁设备而不会对其造成任何损坏。作为dr.fone工具包的一部分,它是一个非常先进的工具,从死机到处于恢复模式,从数据备份到恢复&…

用iPad使用虚拟机的方式,不用越狱,不用安装软件,不用企业签名和开发者账户

最近,有很多人都在疯传首款iOS虚拟机,UTM 但是,我找到了一个比UTM还要好用的虚拟机——PCjs 废话不说,上图 这就是PCjs的首页 有人会说:苹果不是不让带有虚拟机的软件上架吗? 答案是:这只是…

iOS14可以越狱了!苹果关闭了iOS13.7验证通道

iOS13.7关闭签名 iOS 14正式版发布后,苹果对之前的固件停止签证,其实这是必然的事情。苹果当地时间周二停止了iOS 13.7的代码签署,这是iOS 13在上周iOS 14首发前的最后一个迭代版本。停止iOS 13.7代码签署是在苹果推送下一代iOS 14的6天后。 …

专业的iPhone/iPad解锁工具:Tenorshare 4uKey中文版

如果你不小心忘记了自己的iphone或者ipad的屏幕密码,那么Tenorshare 4uKey for Mac帮你哦!将你的设备连接上Tenorshare 4uKey mac中文版后,一键开始删除密码,轻松帮你解锁iPhone,Tenorshare 4uKey mac版兼容最新的iOS …

iBypasser完美支持iOS9-14系统·支持ID登录消息推送

iBypasser目前完美支持ios9-14系统 支持hello界面完美绕过支持重启!支持ID登录,修复消息推送! 支持屏幕锁/停用界面完美绕过(iPhone8 Plus完美测试) 支持删除本地ID账户(隐藏ID)不可以刷机还…

【iOS_锁】

文章目录 前言锁线程安全锁🔒的作用锁的种类互斥锁 自旋锁加锁原理缺点对比自旋锁的缺点互斥锁的缺点 各种锁OSSpinLock使用OSSpinLockOSSpinLock存在缺陷 互斥锁分为两种: 递归锁、非递归锁 os_unfair_lock 【非递归互斥锁】锁的修饰使用 自旋锁的优先级…

淘宝模拟登录 +淘宝商品详情数据、淘宝商品列表数据爬取

PYTHON环境: * requests库 * time库 * re库 实现思路: * 检查此账号需不需要验证(滑动验证/验证码) * 浏览器/工具 获取ua和加密后的密码(一劳永逸的方法) * post请求登录url获取st申请url * 根据获得的st申请地址获取st…

Wolfram语言之父:ChatGPT到底能做什么?

人类语言及其背后的思维模式在结构上比我们想象的更简单、更“符合规律”。 ChatGPT大火,甚至已经开始改变人类的工作和思考方式,充分了解并且认识它,同时看到未来的机会,已经成为每个人迫不及待需要建立的心智。而放眼全球&#…

当 ChatGPT 比你更会写代码,程序员还能干什么?

作者 | 何苗 出品 | CSDN(ID:CSDNnews) 大模型的火热引爆了 AI 编程领域的全面革新,人们开始思考如何借助 AI 提高编程效率的同时,也在思考未来需要怎样的“新程序员”。 3 月 25 日下午,CSDN 与《新程…

Hexo + Butterfly 键入在线聊天功能

原文链接:基于 Hexo 键入在线聊天功能 前言 本站基于Hexo搭建,用的 🦋 hexo-theme-butterfly 主题 ,已经升级到 v4.7.0 。请注意最新的🦋 hexo-theme-butterfly 版本已经更新到 v4.8.1 。 如果你是 v3.7.1 的版本&…

【总结】1642- 前端同学都是如何玩转 ChatGPT 的???

ChatGPT最近一周忽然登上了国内各大平台的热搜榜,应该在去年11月末的时候就有不少同学了解并使用过,那个时候它刚刚问世,在互联网圈子里有了很大的热度,但是对于大众来说,还是不太了解的。 我在去年的时候就跟风注册了…

前端同学都是如何玩转 ChatGPT??

ChatGPT最近一周忽然登上了国内各大平台的热搜榜,应该在去年11月末的时候就有不少同学了解并使用过,那个时候它刚刚问世,在互联网圈子里有了很大的热度,但是对于大众来说,还是不太了解的。 我在去年的时候就跟风注册了…

如何使用网页版微信文件传输助手(图解教程)

微信文件传输助手网页版是一款非常方便的工具,可以帮助我们在电脑和手机之间传输文件,而且不需要电脑登录微信即可传输文件。 下面是具体的操作步骤: 步骤一:打开多御浏览器,点击微信文件传输助手。然后使用微信扫描页…

前端同学都是如何玩转 ChatGPT 的???

ChatGPT最近一周忽然登上了国内各大平台的热搜榜,应该在去年11月末的时候就有不少同学了解并使用过,那个时候它刚刚问世,在互联网圈子里有了很大的热度,但是对于大众来说,还是不太了解的。 我在去年的时候就跟风注册了…

前端同学都是如何玩转 ChatGPT 的?

ChatGPT最近一周忽然登上了国内各大平台的热搜榜,应该在去年11月末的时候就有不少同学了解并使用过,那个时候它刚刚问世,在互联网圈子里有了很大的热度,但是对于大众来说,还是不太了解的。 我在去年的时候就跟风注册了…

ChatGPT 登上了时代杂志封面,意味着什么?

​​​​​​​​​​ 2010年,科兹威尔预测:2030年机器智能将赶上人类。 今天,是2023年⬇️ ChatGPT是一款由OpenAI开发的人工智能聊天机器人,它可以与人类进行流畅、有趣和有意义的对话。它基于GPT-3模型的改进版本,能…

【花雕学AI】11:ChatGPT与New Bing的横向比较与多维度对比测试

引言: 人工智能AI技术正在改变我们获取和使用信息的方式。搜索引擎作为我们与互联网的主要接口,也在不断地进化和创新。2022 年底,两种新型的人工智能搜索引擎,分别是 ChatGPT 和 New Bing,引起了广泛的关注和讨论&…

ChatGPT的火爆出圈,你对它有几分了解?

文章目录 1.ChatGPT是什么?2.ChatGPT能做什么?2-1.什么是自然语言模型? 3.ChatGPT带来的评价4.了解完ChatGPT之后,你会有什么反思?4-1.为什么微软不自己研发ChatGPT?4-2.Elon Musk为什么退出OpenAI公司&…