华为大模型,亟需回到大众视野

8f6d9e70f40bbbd90bd84a4020576ef8.gif

7f6a62e970bbced29a0e10ea321efdc2.png

作者 | 山竹

出品 | 锌产业

在刚刚过去几个月里,人工智能在大众应用层面得到了空前涌现。 

尤其在微软、谷歌、Facebook、Adobe等科技巨头推波助澜下,AI生成文本、AI生成PPT、AI作画、AI抠图……

相信这段时间不少人会和我一样,会对AI产生一种错觉:凡你所想,皆能实现。

上一次对一个技术产生这样的错觉,还是Facebook为了元宇宙更名Meta时进行的一系列酷炫演示。

对于我等凡人,有魄力的,已经在通过做一个应用软件来亲身创业,大部分都仍只是AI的使用者。

而对于当下的科技巨头,应用是次要的,或者说是要留给自己生态里的开发者去做的事儿,他们真正的战场是:大模型。

刚刚过去的三个月里,国外微软、谷歌就大模型之争一直在贴身肉搏,国内更多是大佬创业在引领风向。

时间迈入4月后,国内科技巨头们终于做好了准备,纷纷将大模型的发布提上日程。

这时,华为大模型,也亟需进入(或者说是重新回到)大众视野。

2023年4月8日,当田奇走到聚光灯下时,大家都明白,华为大模型一次非正式发布要来了。

01

谁是田奇?

2018年6月,华为发布了一则人事变动公告,宣布为华为诺亚方舟实验室从海外引进了一位计算机视觉领域华人科学家担任实验室计算机视觉首席科学家,这位科学家就是田奇。 

田奇加入华为的这一年,是国内科技产业亟需新一代顶级科学家引路的一年。

e59f1de6b7bc217ffc78b9bc9a2347f8.png

这一年,国内乃至全球推进物联网、云计算、人工智能新一代信息技术已经走过第一个五年,新一代信息技术创新从蛮荒时代开始转向产业应用,国内科技巨头在这一年纷纷将新一代信息技术写进了企业战略。

要支撑这样长期的技术转型,就需要有顶级人才团队持续输血,顶级科学家的人才之争开始变得激烈。 

尤其阿里在2017年10月成立达摩院后,为这波科学家人才之争和产学研融合之势踩下了最后一脚油门。

当时国内科技巨头大力招揽的科学家基本可以分为两类:

一类是在产业和学术领域都有造诣的产业科学家,例如微软研究院为中国科技公司培养的诸多人才;

另一类是在学术领域造诣颇深的科学家,例如国内外顶级高校的教授学者。 

虽然田奇也曾在微软亚洲研究院多媒体计算组有过一段工作经历,但严格意义上来说,他应该属于后者。

在加入华为之前,田奇最主要的身份是美国德克萨斯大学圣安东尼奥分校计算机系教授,田奇说“我在高校做了17年老师,华为帮助我完成了从高校向公司的过渡。”

加入华为,离开象牙塔的田奇找到了第一份工作,诺亚方舟实验室成了他人生中第一个实战副本。

田奇虽然是以首席科学家的身份加入的诺亚方舟实验室,但这次华为交给田奇的任务是不只有计算机视觉基础研究的任务,还有将研究落地到平安城市、终端视觉、自动驾驶、GTS大脑等各类应用产业向工作。

之后的两年里,随着计算机视觉在制造、金融、零售等行业不断深入落地,田奇也进行了二次转职。

2020年3月,田奇加入华为云,再次出现在大众视野时,田奇已经有了一个新身份,华为云人工智能领域首席科学家。

db0ca32e1087fc0ee94c3942b5534e4e.png

就在田奇加入华为云的这一年,大洋彼岸的一家名为OpenAI的非盈利组织发布了GPT3,由于智能化程度有限,GPT3的发布并没有像GPT4加持下的ChatGPT效果这般震撼,因而也没掀起什么风浪。

不过,GPT3为整个产业界验证了一个猜想:预训练大模型这条路,走得通。

彼时,人工智能发展的一个关键瓶颈是,如何形成人工智能基础设施,让人工智能真正迈入批量化、规模化的工业时代。 

GPT3的发布,证实了预训练大模型这条路的可行性,这就意味着,人工智能有望短期内再向通用技术迈进一大步,人们无需再重复造轮子,未来可以像使用云计算一样使用人工智能。 

华为同样意识到了这一点,开始组建团队造自己的大模型,而华为大模型的牵头人,正是这位在华为已经经过两年锤炼的学术派少帅田奇。

02

盘古,没能开天

2021年是华为架构多变的一年,也是华为云人事任命多变的一年,年初被任命为华为云CEO的余承东,仅仅是在4月的HDC 2021之后,就再次交棒给了张平安。 

不过,田奇在华为云的位置一直未变——人工智能领域首席科学家,也是在这一年和余承东搭班HDC 2021时,田奇正式将华为盘古大模型带到了世人面前。

“今天我们在这里正式宣布我们的盘古大模型正式发布,这是我们最重磅的产品,”在HDC 2021上,余承东如是说。

7602471681b3adf162e394930b05222d.png

尽管在这次华为云公布的六项新技术中,余承东将盘古大模型的介绍放到了第五位来介绍,但他还是强调了盘古大模型的重要性。

针对盘古大模型的能力,余承东会上主要强调的是NLP大模型和CV大模型的小样本学习和泛化能力,而多模态大模型和科学计算大模型当时还在规划中。

而作为盘古大模型的牵头人,田奇更希望能够实现“AI模型的通用性、泛化能力和高精度”。

据悉,盘古NLP大模型是由华为云、鹏城实验室、循环智能联合开发,鹏城云脑II提供算力支持,预训练阶段学习了40TB文本资料,参数规模达千亿级,田奇在大会上也演示了NLP大模型的对话能力。

9a1214c3315ea6197b49c70a7c0d0908.gif

除此之外,华为还拉来国网重庆永川供电公司站台,展示了华为云盘古CV大模型在电力线巡检上的应用能力。

据国网重庆永川供电公司智能运检分公司总助周杰透露,“和小模型相比,应用大模型后,缺陷样本筛选效率提升了30倍,筛选质量提升了5倍,就我们每天采集5万张图片的筛选节省了人工标准时间170人/天。”

按田奇的说法是,当时盘古CV大模型已经能够应用到医疗影像检测、工业缺陷检测和遥感影像分析中。

按照华为官方说法,盘古大模型能力很强,应用性也得到了验证。在会后华为也把盘古大模型主创团队、工程师拉出来进行了一系列介绍和科普。

或许是由于盘古大模型迟迟未能在官网正式上线,再加上并没有像ChatGPT一样面向公众开放,华为盘古大模型和GPT3一样未能在更广泛范围内引起太大关注,甚至在之后两年里逐渐淡出大众视野。 

然而,2023年初,就在ChatGPT引爆全网,大模型随之也再次出现在大众视野中时,关于华为盘古大模型的新闻报道也适时涌现,甚至有媒体报道,盘古大模型终于在华为云官网(预)上线。

5080ea1be07f20d3156b74dd4e5128b6.png

也是在这时,田奇再次走上舞台,为“盘古”摇旗呐喊。

03

华为再谈大模型

4月8日,再次以学术专家站在人工智能大模型技术高峰论坛的舞台上,田奇分享了华为内部对大模型的三层分级理念:

L0:基础模型,例如GPT3,这类模型无法直接应用到行业场景中,需要与行业数据结合,混合训练得到行业大模型;

L1:行业模型,行业模型可以直接在具体细分场景进行部署,由此也就得到了细分场景模型;

L2:细分场景模型。

8d5bb7bcd97e37d24123b4b726eeffe5.png

他指出,在这样的层级关系中,“如何从行业大模型L1中快速生产高质量的部署模型(细分场景模型)L2并部署到端、边、云侧就成了一个重要课题。”

据悉,华为盘古大模型本质上是L0基础模型,在过往几年里也尝试在不同行业进行了落地应用。

大会上,田奇对这些年华为盘古大模型的具体演进路线,进行了如下梳理:

  • 2019年-2021年之间,华为开始立项做盘古大模型;

  • 2021年4月发布了盘古NLP大模型1.0、盘古视觉大模型,当年也发布了盘古科学计算大模型;

  • 2021年9月,针对小分子药物筛选发布了盘古药物分子大模型;

  • 2022年6月,针对行业应用,华为与能源集团合作发布了盘古矿山大模型;

  • 2022年11月,华为发布了盘古气象大模型、海浪大模型、金融OCR大模型。

9b90b97f38c538c7b8d5ad2f5e2bd517.png

此外,针对行业应用,田奇也列出了华为盘古三类大模型在工业质检、物流仓储监控、时尚辅助设计、智能文档搜索、智能ERP、小语种大模型、气象预报、海浪预测的具体应用场景。

8fe608d7c75c7f4cd4683fed4cf2619c.png

这次论坛上,在与前后几位院士、学者的观点交锋中,田奇演讲全程并未提到“发布”二字,但如果加上前期媒体的宣传报道,以及当下大家对科技巨头大模型的敏感度,这次田奇携盘古大模型的公开亮相,也足以在这关键时刻,将华为大模型带回到大众视野。

04

科技巨头的关键一役

2023年4月3日,斯坦福大学发布《2023 年人工智能指数报告》,报告中指出,AI模型的研发优势已经从学术界转移到了工业界。

报告中的一个关键数据是,到2022年,工业界产生了32个重要的AI模型,而学术界只有3个。

2c8536089545e074ab0016e9ce95f9f0.jpeg

斯坦福的这份报告也分析了出现这一现象出现的原因,其中最重要的一个原因是创建这类AI模型所需要的数据、人才、算力等方面的资源要求越来越大。

2019年,OpenAI的GPT2训练用了15亿个参数,花了5万美元;2022年,谷歌的PaLM训练用了5400亿个参数,训练成本预计已经达到800万美元。

仅仅训练成本,二者相差160倍,而这样的烧钱大战还在加剧。

2023年,当大模型成为主流趋势后,行业中一个主流观点是,这也将是科技巨头之间决定生死存亡的一战。

于是,我们看到,在刚刚过去几个月里,国内李开复、王慧文、王小川等曾经互联网大厂关键战力们纷纷官宣再创业,百度、360不顾翻车风险也秀出了自己的ChatGPT。

而华为盘古大模型的再“发布”,也让华为的大模型重新回到大众视野。

除此以外,我们也看到,阿里通义大模型、科大讯飞1+N认知智能大模型等更多大模型正在跑步入场。

被誉为科技巨头生死战的大模型之战,最终究竟谁会胜出,又将如何成为我们生活中的“水”和“电”,我们拭目以待。

巴比特园区开放合作啦!

738e25cca3d89a096696782ba3fe2705.png

e9c99a5c8287eefa0326de7bf5b3c66b.jpeg

b34ae9d3d0ea749b37db7fae6cd4e642.gif

中文推特:https://twitter.com/8BTC_OFFICIAL

英文推特:https://twitter.com/btcinchina

Discord社区:https://discord.gg/defidao

电报频道:https://t.me/Mute_8btc

电报社区:https://t.me/news_8btc

fd3634ba16026fd44b0be9dd00b3f876.jpeg

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/48530.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

搜索技术理论之父出生 | 历史上的今天

整理 | 王启隆 透过「历史上的今天」,从过去看未来,从现在亦可以改变未来。 今天是 2023 年 3 月 8 日,在 1857 年的今天,美国纽约制衣和纺织女工举行了首次大型抗议活动。妇女节是纪念妇女权利运动的国际性节日。设立国际妇女节的…

全渠道定价、库存决策,混合整数规划建模求解,MNL选择模型,内附代码!

1. 文章信息# 基本信息 (1)发表期刊:Transportation Research Part E(10.047/Q1,运输领域的good good刊 ૮ ͈ ᗜ ͈ ა♡) (2)标题:Fulfillment and pricing optimizati…

让我们一起来了解什么是人工智能吧

前言 最近这几年”人工智能“相关的话题热度一直很高,1997年5月11日深蓝战胜当时的国际象棋世界冠军卡斯帕罗夫, 2017年5月27日 AlphaGo战胜当时的围棋世界冠军柯洁,一次又一次让世人感到震惊,再到如今爆火出圈的ChatGPT。笔者也一…

悉尼大学计算机研究生学制,悉尼大学研究生一般读几年?九大领域研究生学制盘点!...

悉尼大学是澳洲最知名的八大院校之一,该校的研究生课程备受留学生青睐,以下是悉尼大学九大领域的研究生学制详情: 一、Architecture、design and planning建筑、设计和规划 研究生学制—— 研究生证书课程为0.5年制,研究生文凭课程…

悉尼科技大学计算机科学,悉尼科技大学计算机专业

原标题:悉尼科技大学计算机专业 悉尼科技大学计算机专业 悉尼科技大学的信息技术专业能让学生在技术和管理领域获得全面和深入的理解。本专业有多个方向,可以满足学生的职业发展的需求。当今时代拥有IT知识和技术是至关重要的,本专业能加强学…

悉尼大学计算机硕士健康科技,悉尼大学健康科学学院

悉尼大学健康科学学院的前身是辅助医学研究学院,成立于1973年。该学院主要针对物理治疗,职业病治疗,以及语言 病理学三个学术领域提供高等教育课程。并且在1975年, 将NSW College of Nursing的高级护士注册课程也纳入学院的课程作…

悉尼大学计算机科学硕士专业,悉尼大学计算机硕士

原标题:悉尼大学计算机硕士 介绍,悉尼大学是澳大利亚第一所大学,其信息技术(IT)学院因致力于精英教育和创新研究而备受尊崇,并晋身工程和技术专业世界排名35之列。根据当前各行业对高级信息技术人才的广泛需求,该大学通…

悉尼大学计算机科学专业,悉尼大学计算机科学专业怎么样

悉尼大学计算机科学专业为计算机科学方向。基于扎实的计算机科学和数学方面的基础知识,学生能够对现代计算机系统有比较全面且深刻的理解。在该专业的学习中,学生将学习到该行业的计算机设计、研发、安装、集合与维修等必备的技巧。该专业分为三大专攻方…

悉尼大学计算机科学专业,悉尼大学计算机科学专业

悉尼大学计算机科学专业为计算机科学方向。基于扎实的计算机科学和数学方面的基础知识,学生能够对现代计算机系统有比较全面且深刻的理解。在该专业的学习中,学生将学习到该行业的计算机设计、研发、安装、集合与维修等必备的技巧。该专业分为三大专攻方…

悉尼大学计算机录取要求,悉尼大学录取要求

原标题:悉尼大学录取要求 悉尼大学按照专业不同,录取要求也不尽相同,具体录取要求如下,1.商科方向,学术,985院校75%,211院校75%,双非83%,语言,雅思7单项6,托福…

悉尼大学计算机一年制硕士,悉尼大学一年制硕士

澳洲也有许多学校开设了一年制硕士课程,悉尼大学就是其中之一。悉尼大学的一年制硕士课程有Master of International Business,.Masterof EducationMaster of Engineering等。 悉尼大学一年制硕士课程介绍 1、Master of International Business 学制&…

Speech and Language Processing-导读

朋友们,最近打算做一个大工程,我曾多次提过,chatgpt未来将是一股非常大的信息技术革命,有的人不以为然,或者国内很多企业好像并不是很重视,以我从业多年来的经验,chatgpt与之前的NLP技术有着较为…

PDFgear——一款接入AI智能化模型的免费PDF聊天软件

目录 一、前言 二、产品介绍 2.1、PDFgear是什么? 2.2、PDFgear能做什么? 2.3、技术规格 三、产品安装 四、功能介绍 4.1、PDF聊天 4.1.1、支持和PDF进行聊天 4.1.2、支持上传多个PDF对话 4.1.3、始终保持会话不会丢失 4.1.4、完全免费和PD…

区块链技术在金融领域的应用与思考

ChatGPT狂飙160天,世界已经不是之前的样子。 新建了人工智能中文站https://ai.weoknow.com 每天给大家更新可用的国内可用chatGPT资源 一、区块链技术的特点及市场情况 区块链技术作为一种分布式记账技术,其最大的特点是去中心化。这意味着所有参与者可…

【CICC原创】面向智能博弈的决策Transformer方法综述

来源:中国指挥与控制学会 (《指挥与控制学报》刊文精选) 引用格式 罗俊仁, 张万鹏, 苏炯铭, 等. 面向智能博弈的决策 Transformer 方法综述 [J]. 指挥与控制学报, 2023, 9 (1) : 9-22. LUO J R, ZHANG W P, SU J M, e…

2023年4月的12篇AI论文推荐

GPT-4发布仅仅三周后,就已经随处可见了。本月的论文推荐除了GPT-4以外还包括、语言模型的应用、扩散模型、计算机视觉、视频生成、推荐系统和神经辐射场。 1、GPT-4 Technical Report Sbastien Bubeck, Varun Chandrasekaran, Ronen Eldan, Johannes Gehrke, Eric…

OpenAI API调用

上次简单写了一篇对ChatGPT的一些看法,最近想深入研究一下。 极客时间上有个课程《AI大模型之美》,看了一下还可以。当做入门是不错的,但还是有很多细节可以打磨,不过毕竟是在风口上的课,也能接受。 本次演示如何调用…

B+G双轮驱动,税友股份迎来数字化东风

配图来自Canva可画 不知不觉之间,国内的数字经济已经蔚然成潮。据相关部门的统计数据显示,去年国内数字经济规模已经达到了50万亿,占到了国内GDP总量的40%以上,增速更是持续领先于GDP增速。与此同时,随着数字中国战略…

Controller 层如何写才能简洁又优雅!

更多内容关注微信公众号:fullstack888 一个优秀的 Controller 层逻辑 说到 Controller,相信大家都不陌生,它可以很方便地对外提供数据接口。它的定位,我认为是不可或缺的配角。 说它不可或缺是因为无论是传统的三层架构还是现在的…

AI对话交互场景使用WebSocket建立H5客户端和服务端的信息实时双向通信

WebSocket使得客户端和服务器之间的数据交换变得更加简单,允许服务端主动向客户端推送数据。在WebSocket API中,浏览器和服务器只需要完成一次握手,两者之间就可以创建持久性的连接,并进行双向数据传输。 一、为什么需要 WebSock…