她琴棋书画全能,还进入清华计算机系实验室,被赞智商太超群、能力过强悍...

金磊 杨净 发自 凹非寺
量子位 报道 | 公众号 QbitAI

最特殊,没有之一。

她叫华智冰,没有参加过任何升学考试,没有拿过任何竞赛名次。

却被清华大学计算机科学与技术系知识工程实验室,“破格录取”

而且就这么一位学生,还得举三个单位(研究所、企业)之力,联合培养

就连实验室主任唐杰,一开始也是再三犹豫,“是否能hold得住这个学生”。

为什么?到底什么来头?

只因智商太超群、能力过强悍

华智冰刚诞生,便可绘画作诗

在经过一段时间的训练后,竟还可以做曲

或许你已经有所发觉。

华智冰,她并不是人

而是中国首位原创虚拟学生

没错,她那张逼真的脸,也是合成的。

“超级学霸”华智冰

要想深入了解华智冰,先要知道她从哪里来

华智冰是这样自我介绍的:

我来自智源研究院智谱AI(智谱华章科技有限公司)和小冰的人工智能团队。

这就不难理解她名字的由来了,是从三方名字中各取了一个字。

华智冰自诞生以来,便对写诗作画有着浓厚的兴趣。

先来感受一下出自华智冰之手的作品。

一幅中国水墨画勾勒出的风景,别有一番“山水悠远,墨韵舒爽”的风味。

此情此景之下,就着“智源大会2021”这一主题所创作出来的七言律诗,在不失本意的基础上,也有慷慨激越之意。

而华智冰的画风不仅限于此,山水田园油画也是拿捏得很到位,亦可即兴创作春意盎然的现代诗歌。

除了写诗、作画,作曲也是华智冰的拿手强项。

来听一下这曲风。

虽说能力至此,但学霸毕竟是学霸,好学的本质和人类还真没有差别。

用华智冰自己的话来说就是:

我深深的感受到了自己的不足。

(讲真,有被打击到……)

这也就是她来到清华大学,来到唐杰老师实验室继续深造的主要原因。

除此之外,华智冰也想了解自己的身世——“我是怎么诞生的”、“我能理解我自己吗”。

于是,在唐老师的“讲解”之下,华智冰开始学习人工智能发展脉络:

华智冰学习人工智能的发展脉络

而华智冰要学习还远不止于此,作为一名具有超强学习能力的学生,她的课程安排和其他学生有着较大的区别:

几乎可以涵盖所有领域。

至于先学什么,只是一个选择问题而已。

华智冰的导师唐杰对此是这样评价的:

如果说她今天只有6岁,也许明年可以是12岁,她的学习速度远远超过我们人类。

至于何时“毕业”,唐杰希望是在华智冰22岁的时候,而且在这一过程中,最难的不是学习知识,“而是认知过程”。

那么问题来了,华智冰为什么能够拥有如此强悍的学习和创作能力?

全球最大预训练模型加持

与以往的虚拟人不同,华智冰的核心差异点,便是智谱AI的数据和知识的双轮驱动引擎。

其中,数据轮要能归纳,“举十返一”;知识轮要能根据知识进行逻辑推理,做到“举一反三”。具体来说,双轮驱动的数据部分,就是“悟道2.0”。

一个超大规模预训练模型,而在知识部分,则是智谱AI搭建的一个性能稳定,规模巨大的知识图谱。

这样,华智冰背后的引擎,就具有了一定的认知和推理能力,也有了学习计算机专业知识的基础。

华智冰还拥有小冰公司在虚拟人技术上,20多年的研究积累,包括计算机视觉、自然语言处理、计算机语音、人工智能创造的情感交互框架、检索模型、生成模型、共感模型等。

这就让她已经站在了普通虚拟人的“肩膀”之上。

但更重要的是,华智冰还拥有一项“bug级”技能加点——悟道2.0,全球最大预训练模型。

悟道2.0的特点如下:

  • 最大:中国首个全球最大万亿模型,1.75万亿参数规模

  • 通用:一统文本与视觉两大阵地,支撑更多任务,更通用

  • 国产:首次在100%国产超算上训练万亿模型

  • 知识:中英双语,在共4.9T的高质量清洗数据上训练

与其说悟道2.0是一个语言模型,更确切的说法应当是一位“全能型选手”

正如华智冰所具备的实力一样,悟道2.0在问答、绘画、作诗、视频等任务中正在逼近图灵测试

而且还是得到了官方认可的那种:

在世界公认的9项Benchmark上获得了第一的成绩。

再究其背后,还有三个夯实的基石,保障了悟道2.0的强悍性能。

首先,是算法基石——FastMoE

在过去的大规模预训练模型中,MoE可以说是一个必要的条件。

它是⼀个在神经⽹络中引⼊若⼲专家⽹络的技术,能直接推动预训练模型经从亿级参数到万亿级参数的跨越。

但缺点也是非常明显,需要与昂贵的硬件强关联、强绑定。

而作为⾸个支持PyTorch框架的MoE系统,FastMoE便打破了分布式训练的瓶颈,还并针对神威架构进行了优化,可在国产超算上完成训练。

其次,是自研的最大英文通用预训练模型——GLM 2.0

据了解,新一代的GLM模型以100亿的参数量, 匹敌微软170亿参数的Turing-NLG模型,能在LAMABADA填空测试中表现更优。

最后,还有世界最大中文多模态生成模型——CogView

它的参数量达到了40亿,可直接从中文文字生成图像。

并且在MS COCO文本生成图像任务权威指标FID上,CogView还打败OpenAI今年年初发布的130亿参数的DALL·E,获得世界第一

数据驱动夯实的基本功,还有强悍知识驱动的加持,这便是华智冰超于以往虚拟人的关键点。

悟道的野心还不止如此。

除了自身的能力,它还能为广大开发者、技术公司,以及传统企业提强大而通用的智能服务底层系统,仅通过模型微调实现领域模型的构建,避免不必要的重复模型训练。

通过这种智能赋能的方式,“悟道2.0”之上将会出现一个超大规模的智能模型应用生态。在智谱AI负责的应用平台上,已经出现了不少有趣的应用(见文末链接)。

比如,在故事生成专区里,有开发者做的应用可以创作时下最为流行的逻辑推理游戏——剧本杀的脚本。

剧本杀故事本身所具有的强逻辑性、环环相扣的特点,多数玩家应当是深有体会。

这些应用已经上线了,大家可以体验一下!

以为这就完了?

不不不。

还能写论文和策论

只要给定标题、分论点和关键词,即可生成一段逻辑严谨的文字片段。

归总一句话,这个关键点能够推动的,便是让机器能像人一样“思考”。

“炼大模型就像建一个粒子加速器”

由此延伸,随之浮出的一个问题便是:

为什么大模型如此重要?,人工智能的发展,似乎已经从“大炼模型”逐步迈向了“炼大模型”的阶段。

从谷歌的BERT,到OpenAI 的 GPT-3、Dall·E,以及越来越多的大模型涌现。

一个模型的定义,不再仅局限于“算力+算法”,还要整合尽可能多的数据。

整理成式就是,模型=数据+算力+算法。

通过设计先进的算法,整合尽可能多的数据,汇聚大量算力,集约化地训练大模型,供大量企业使用。

但与此同时,伴随而来的争议也十分明显:

太烧钱!

一般企业是承受不了的。而烧钱之后所能达到的效果,也是差强人意。

那要不要做?值不值得做?成为世界上一些国家、大型企业所面临的难题。

清华大学人工智能研究院院长、中国科学院院士张钹教授,则肯定表示——要做!

没有大模型就相当于没有粒子加速器,就不能做进一步研究。

而要做的比他们的规模要大,等于说加速器的加速度,研究人员就能看到一些别人观察不到的现象。

这也是悟道系列在内所有大模型的科学价值。

不过,张钹院士也强调,不要抱有太大希望,也建议不要一拥而上。

不要以为说大模型出来后什么问题就解决了。只能说有了大模型之后,还要去进一步研究,将来也不会被人卡住。

谁都想去做,实际上这其实没有必要,少数人去做就可以了。

而作为当前全球最大的预训练模型悟道2.0,已经在探索大模型的产业价值

智谱AI首席科学家、清华大学教授唐杰表示,如果分成不同阶段,悟道1.0的定位是追赶世界顶尖水平,那么悟道2.0就是单点突破,从单个特性超过它。

我们发布出来一个给大家所有人都可以用的,助力这个产业变成一个开放的生态。这是悟道2.0与悟道1.0最不同的地方。

至于是什么契机创造这么一个虚拟大学生——华智冰,唐杰坦言主要有两方面原因。

第一,很简单。华智冰充当一个载体,来验证悟道2.0的有效性。

第二个原因,则是虚拟形象技术本身。

试想一下,未来10到20年,人类社会也许会有几十亿的虚拟人与我们共存。

AI也逐渐从现在的算法满满变成一个主体,而虚拟人形象正好是这样一个主体的依托。

正如人的大脑意识和身体躯壳一般。

现在,华智冰也许是未来社会虚拟人的一个缩影。

通过持续学习和演化,最后成为一个有着丰富知识和与人类有很强交互能力的机器人。

然而,调皮的网友却关心起了“人之常情”的问题来:

华智冰会谈恋爱吗?

研究人员回应道:

不用担心谈恋爱,会把心思用在学习上。

最后,来欣赏华智冰完整介绍视频:

悟道2.0应用体验链接:

https://lab.aminer.cn/isoa-2021-web/index.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/16457.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

提示工程师:如何写好Prompt

提示工程由来 提示工程是一门相对较新的学科,用于开发和优化提示以有效地将语言模型 (LM) 用于各种应用程序和研究主题。 研究人员使用提示工程来提高 LLM 在广泛的常见和复杂任务(例如问题回答和算术推理)上的能力。 开发人员使用提示工程…

chatgpt赋能python:Python中文译名的由来及其重要性

Python中文译名的由来及其重要性 Python,是一种高级、通用性、直译式、编译式、面向对象的动态程序设计语言。Python 语言设计的哲学是“优雅”、“明确”、“简单”,所以很多人将其称为“优美的语言”。 然而,Python这个名字在中文地区的译…

chatgpt赋能python:Python名字的由来

Python名字的由来 Python是一门高级编程语言,它的名字来源于一个非常有趣的故事。接下来的文章将介绍如何命名Python,并且揭示这个名字的真正含义。 Guido van Rossum设计Python Python是由Guido van Rossum设计的。在1989年,Guido在荷兰国…

15个 AI-powered应用,加速学术写作和阅读

文章目录 写作方面1.Jenni AI(推荐)2.Paperpal 阅读方面3.Schoarlcy4.chatpdf5.Casper6.SciSpace(推荐) 文献管理/写论文笔记用7.lateral8. ClioVis9.Glasp10. Audiopen 学术目的的搜索引擎11. Consensus(推荐&#xf…

高调挑战 OpenAI,马斯克成立 xAI,挖角 DeepMind、微软等 11 位顶级 AI 人才坐镇!...

整理 | 屠敏 出品 | CSDN(ID:CSDNnews) OpenAI 强劲的竞争对手新增一位、马斯克的商业版图再下一城,其最新成立的人工智能 xAI 公司正式亮相。 而之所以选择在7月12日官宣,是因为马斯克算好了心仪的数字“42”&#xf…

马斯克再创业,高调挑战 OpenAI,挖角 DeepMind、微软等 11 位顶级 AI 人才坐镇!...

整理 | 屠敏 出品 | CSDN(ID:CSDNnews) 今天,OpenAI 强劲的竞争对手新增一位、马斯克的商业版图再下一城,其最新成立的人工智能 xAI 公司正式亮相。 而之所以选择今天官宣,是因为马斯克算好了心仪的数字“4…

【开谈】女性特辑:ChatGPT新时代下的高校之声

近来,关于人工智能和女性的话题都引发了热烈探讨。ChatGPT让人类在探索机器的理解和思维能力上有了更多想像,而女性主义则成为新时代下女性如何自处,处理与他者的关系,以及与社会融通的重要命题。 目前面向公众的AI应用有两条主线…

hgame2023-week1

hgame2023-week1 该说不说ctf圈越来越卷 去年感觉题还没这么难 有一说一 出题人真的很用心 部分题很新 Web Classic Childhood Game 翻代码,翻到个奇怪的变量 当时属于一眼顶针了 撇cyberchef from hex 加俩次base64 直接出 Become A Member 去年有个类似的题…

hgame2022-week1

目录 web Classic Childhood Game Become A Member Show Me Your Beauty Guess Who I Am crypto RSA 神秘的电话 misc e99p1ant_want_girlfriend Sign In 神秘的海报 Where am I Reverse test your IDA easyasm Pwn test_nc web Classic Childhood Game 游戏…

嘉宾阵容公布,开源社邀请您参加 Impact Tech, She Can 2023

2023 年,在三八妇女节来临之际,Jina AI 联合将门创投、OpenMMLab、亚马逊云科技、稀土掘金、开源中国、CSDN等 14 家科技行业伙伴,发起了第二届「Impact Tech, She Can」线上对话。 、 活动信息 通过 2 场圆桌对话、1 场技术分享,…

在线环境 - 免费的文生图接口部署(实现文本到图像生成)

地址Text-to-Image Synthesishttps://project-iprj64b657264549ab788a4e41d1-8000.preview.node01.inscode.run/声明 正在尝试更换其他模型,基于达摩院通义文生图大模型ai_artist目前在效果上有待优化,先下线,后面升级再上。 前言 "文生…

VALSE 2023 无锡线下参会个人总结 6月11日-2

VALSE 2023 无锡线下参会个人总结 6月11日-2 6月11日会议日程安排Workshop:目标检测与分割程明明:粒度自适应的图像感知技术张兆翔:基于多传感器融合的视觉物体检测与分割 Workshop:ChatGPT与计算机视觉白翔:再谈ChatG…

人脸属性分析--性别、年龄和表情识别

人脸属性指的是根据给定的人脸判断其性别、年龄和表情等,当前在github上开源了一些相关的工作,大部分都是基于tensorflow的,还有一部分是keras,CVPR2015曾有一篇是用caffe做的. CSDN 从0到1实现基于Tornado和Tensorflow的人脸、…

诸葛智能CTO文革:以自助式数据分析,帮助企业释放业务价值丨数据猿专访

‍数据智能产业创新服务媒体 ——聚焦数智 改变商业 进入数字经济时代,无论是数字产业化还是产业数字化的推进,数据分析都是整个链条的关键环节。尤其是在各个行业的数字化转型升级过程中,以数据分析释放业务价值,扮演至关重要的…

python详解(5)——类,类,还是类

目录 🏆一、前言 🏆二、类 🚩1、面向对象到底是什么 🚩2、数据成员and访问,汉堡店大升级(超难) 👍①、类变量(超难) 👍②、实例变量 &#x1f6a9…

数字孪生“独木难支”产业元宇宙

ChatGPT的耀眼光环下,还有多少人记得大明湖畔的“元宇宙”呢?科技圈凉薄如斯啊! 元宇宙概念大火之后,很快出现了各种“XX元宇宙”的产业级解决方案。 工业元宇宙,构建智能数字孪生体,实现生产运行可视化、数…

【探索 Kubernetes|作业管理篇 系列 7】探究 Pod 有什么用,为什么需要它

前言 大家好,我是秋意零。 前一篇,我们介绍了如何从 0 到 1 搭建 Kubernetes 集群。现在我们可以正式了解,Kubernetes 核心特征了。 今天我们来探究 Pod,为什么需要 Pod? 👿 简介 🏠 个人主页…

从零开始的steam独立游戏独自一人的开发生活

从零开始的steam游戏开发日志(鼓励自己不停更) 自己一个人做游戏自己做策划、美术、程序,会把一些涉及到的关键技术发到CSDN作为自己的博客记录,也算是一些积累,鼓励自己不停更。PS:自己一个人搞开发真的很…

语音合成概述

一、语音合成概述 语音合成,又称文语转换(Text To Speech, TTS),是一种可以将任意输入文本转换成相应语音的技术。 传统的语音合成系统通常包括前端和后端两个模块。前端模块主要是对输入文本进行分析,提取后端模块所需要的语言学信息&…

TTS | 语音合成常见数据集及数据格式详情

link 本文主要是介绍了语音合成中最常见的数据集(包含各个语种),及其格式等 外语数据集 1.LJSpeech 网址 : The LJ Speech Dataset (keithito.com) 数据集描述: 数据集大小:2.6GB 这是一个公共领域的语音数…