网易在文本及多模态预训练技术的研究与应用

在 CSDN 与《新程序员》合作举办的「新程序员大会(NPCon)——AIGC 与大模型技术应用论坛」上,来自网易伏羲实验室资深研究院 NLP 研究组及多模态算法负责人带来了《文本及多模态预训练技术的研究与应用》的精彩分享。

张荣升介绍了网易伏羲实验室在大模型方向的技术积累,包括文本多模态理解和生成预训练模型的建设,以及大模型在歌词辅助创作、文字游戏和互联网搜索推荐等领域的应用案例。

  • 直播回放:https://live.csdn.net/room/programmer_editor/Nc8cfWuo

在这里插入图片描述

张荣升,网易伏羲实验室资深研究员

以下是张荣升的演讲内容:

我接下来跟大家分享伏羲在文本预训练和多模态预训练方面的一些研究与应用。首先是从去年下半年开始,像 ChatGPT 面世,还有 Stable Diffusion,包括后来英伟达推出的 Magic3D,其实他们的底层都是离不开这个预训练技术,或者说叫大模型。从这几年来看的话,加大预训练模型规模及提升数据质量已成为获得更好的人工智能效果的重要手段。

在这里插入图片描述大家可以看到这张图,这是近几年预训练模型规模增长图。ChatGPT 虽然没有公布参数,但和它对等的谷歌的PLM已经是达到 5400 亿。

本图也是 PLM 论文里面贴出来的。在 58 个任务上,它的一个效果都已经有一个明显的提升,而且已经是超过了一个人类的平均水平。

ChatGPT 能够广受欢迎的原因在于其能够解决人与模型之间的通信问题,或者说在于其成熟的能力去理解人类的意图。数据是这一切的关键因素,不论是第一步还是第二步,都需要有高质量的数据。因此,对于现代的大型语言模型而言,数据的质量是至关重要的。

人去标注数据,然后训练这个反馈模型,它都是离不开高质量的数据,所以说目前大模型已经脱离了这种参数在无限扩大的这个时代,它已经到了去强调自我预训练模数据的一个质量。

近年来,围绕大模型,从硬件,然后到深度学习框架,以及到模型本身,还有它上层的各种各样的商业应用的发展,是非常非常多的。包括近两年在多模态领域得到一个非常快速的一个发展。

在这里插入图片描述MidJourney和GPT-4等模型现在都支持多模态理解,这是未来发展的趋势之一。预训练模型正在朝着多模态的方向发展,可以理解各种数据的形式和表现形式。网易从2019年初开始就一直在研究预训练模型,已经有四年多的时间了。我们基于技术积累,申请了浙江省的一个尖兵项目,主要内容是构建一个超大规模的预训练模型平台。

在这个云平台上,我们将基于文本、图像、音乐和行为序列等数据建立大型模型。我们还将建立计算优化引擎来解决推理成本的问题,以支持另一个大型模型的应用。在此基础上,我们将开展各种应用,包括高效微调和特定垂直领域场景的应用。这是伏羲近四年来预训练模型发展的路径。

在这里插入图片描述
在 2020 年底至 2021 年初,即在 ChatGPT 发布之前,我们开始分析游戏中的用户行为日志,用于反外挂和推荐等方面的应用。这些分析都是基于玩家行为序列进行的。由于玩家行为序列可能有自己的符号表达形式,因此我们当时进行的预训练是针对这种行为序列的。从2亿到4亿再到如今一个9亿的预训练模型。

在图文生成领域,我们从去年5、6月份开始构建中文领域的图文生成和动图文生成的预训练模型。在预训练的过程中,我们不仅涉及到预训练模型本身,还需要构建一个计算平台。因此,我们建立了自己的云平台,该平台可以调度网易的算力,并与公有云的算力进行连接。

在大模型推理这边的话,我们也是开源的一个项目,这个项目的话,我们是针专门针对transform 为底座的这个模型去做了一系列的推理优化,推理时候的一个性能提升的大概能提升一倍到八倍的一个水平。

下面分享一下我们文本预训练方面的内容。我们文本预训练叫“玉言”。
在这里插入图片描述

在这里插入图片描述
下面分享一下我们在文本预训练模型上的具体应用落地案例。

第一个案例便是网易《遇见逆水寒》游戏内的“傀儡戏”玩法,让玩家和 AI 共同创作剧本,进行角色扮演。其实现方式为通过一个 GPT 模型,将玩家输入和故事状态连接,送入预训练的文本生成模型生成候选答案,再经过目标判定模块判定。
在这里插入图片描述
第二个案例是在 Loft 上进行AI 写文辅助,用户输入一些故事开头,然后让 AI 去创作故事情节,用户再此基础之上再做二次修改。

第三个案例是网易“有灵”歌词辅助创作。大模型技术让这种创作型的业务也有了工具,它可以提供内容和格式多维度定制生成,还能联系上下文进行局部修改。

在这里插入图片描述在多模态预训练模型技术的研究与应用方面,我们伏羲团队基于 clip 框架构建了自己的数据库,其中大约有 9 亿条中文数据,包括 7 亿条互联网数据和 2 亿条开源数据,其模型能力在市面上已经得到了验证。

图文理解预训练模型可以利用海量的数据,处理中文情景下的文本图像理解以及对风格化图像的微调,同时针对游戏业务或互联网业务需求进行定制,进行游戏制作领域较为繁琐、需求较大的图标生成功能,甚至完成 AI 绘制视频插画。这种思路将为整个行业带来启迪,推动文本创作和多模态创作的产业革命更新。

下面是我们网易 AI 生成的一些案例图:
在这里插入图片描述在这里插入图片描述在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/8880.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【雕爷学编程】Arduino动手做(141)---AS608光学指纹识别模块

37款传感器与执行器的提法,在网络上广泛流传,其实Arduino能够兼容的传感器模块肯定是不止这37种的。鉴于本人手头积累了一些传感器和执行器模块,依照实践出真知(一定要动手做)的理念,以学习和交流为目的&am…

微软旗下GitHub宣布裁员10%;谷歌高管警告:AI聊天机器人会产生错觉;华为称在ChatGPT领域早有布局丨每日大事件...

‍ ‍数据智能产业创新服务媒体 ——聚焦数智 改变商业 投融资 迈铸半导体完成1500万Pre-A轮融资 近日,原创技术晶圆级微机电铸造技术及应用方案提供商上海迈铸半导体科技有限公司(下简称“迈铸半导体”)于2月10日宣布完成1500万Pre-A轮融资…

2023世界人工智能大会这些消息不容错过;大模型生态合作共同体正式发起;微软从ChatGPT中赚900亿美元丨每日大事件...

‍ ‍数据智能产业创新服务媒体 ——聚焦数智 改变商业 企业动态 阿里云通义大模型新成员——通义万相正式上线 在2023年世界人工智能大会上,阿里云正式推出AI绘画新品“通义万相”。通义万相基于阿里云“通义”大模型能力打造,用户可以在通义万相中输入…

ChatGPT的狂欢背后:短板犹在,启发甚多,2023有这些事可以做……

ChatGPT 的强大能力是与生俱来的吗?它有哪些短板?未来它会取代搜索引擎吗?它的出现给我们的 AI 研究带来了哪些启发?针对这些问题,几位 AI 研究者展开了深入对谈。 2022 年的最后一个月,OpenAI 用一个爆款对…

ChatGPT 的狂欢背后:短板犹在,启发甚多,2023 有这些事可以做……

这是「进击的Coder」的第 781 篇技术分享 编辑:张倩 来源:机器之心报道 “ 阅读本文大概需要 13 分钟。 ” ChatGPT 的强大能力是与生俱来的吗?它有哪些短板?未来它会取代搜索引擎吗?它的出现给我们的 AI 研究带来了哪…

插值字符串格式化定制程序结果输出(f‘{object}‘)

【学习的细节是欢悦的历程】 Python 官网:https://www.python.org/ Free:大咖免费“圣经”教程《 python 完全自学教程》,不仅仅是基础那么简单…… 地址:https://lqpybook.readthedocs.io/ 自学并不是什么神秘的东西&#xff0…

让chatGPT当我的老师如何? 通过和chatGPT交互式学习,了解在ES中,一条JSON数据是如何写到磁盘上的

最近一直有一个问题,如鲠在喉。争取早一天解决,早一天踏踏实实的睡觉。 问题是:在ES中,一条JSON数据是如何写入到磁盘上的? 如何解决这个问题?我想到了chatGPT,还有lucene的学习资料。这篇文章&…

python-chatgpt自动化批量改写文章-基于gpt-3-5-turbo模型

作者:虚坏叔叔 博客:https://xuhss.com 早餐店不会开到晚上,想吃的人早就来了!😄 一、ChatGPT官方文档介绍: ChatGPT API—0.002美元,1000个token。比之前的GPT-3.0,成本直接降低了9…

或许你不信,但是强于ChatGPT的模型已经出来了。。。

每天给你送来NLP技术干货! 来自:量子位 点击这里进群—>加入NLP交流群 因不满老东家成为微软附庸,11名OpenAI前员工怒而出走。 如今带着“ChatGPT最强竞品”杀回战场,新公司估值50亿美元,一出手就获得3亿美元融资。…

OpenAI网站3月份独立访问量突破8.47亿,增长54%;10分钟搭建自己可免费商用的ChatGPT环境

🦉 AI新闻 🚀 OpenAI网站3月份独立访问量突破8.47亿,增长54% 摘要:据营销机构VezaDigital的调查数据显示,今年3月份共有8.47亿用户访问了OpenAI的网站,比2月份增长了54%。OpenAI是爆火聊天机器人ChatGPT的…

ChatGPT详解:发展历史、原理、技术架构及产业未来探讨

去年12月1日,OpenAI推出人工智能聊天原型ChatGPT,再次赚足眼球,为AI界引发了类似AIGC让艺术家失业的大讨论。据报道,ChatGPT在开放试用的短短几天,就吸引了超过 100 万互联网注册用户。并且社交网络流传出各种询问或调…

腾讯回应考生喊话马化腾;库克承认在使用 ChatGPT;OpenHarmony 4.0 Beta1 发布|极客头条...

「极客头条」—— 技术人员的新闻圈! CSDN 的读者朋友们早上好哇,「极客头条」来啦,快来看今天都有哪些值得我们技术人关注的重要新闻吧。 整理 | 梦依丹 出品 | CSDN(ID:CSDNnews) 一分钟速览新闻点&#…

腾讯回应考生喊话马化腾;库克承认在使用 ChatGPT;OpenHarmony 4.0 Beta1 发布 | 极客头条

「极客头条」—— 技术人员的新闻圈! CSDN 的读者朋友们早上好哇,「极客头条」来啦,快来看今天都有哪些值得我们技术人关注的重要新闻吧。 整理 | 梦依丹 出品 | CSDN(ID:CSDNnews) 一分钟速览新闻点&…

大语言模型汇总(ChatGPT、盘古、通义、文心一言、混元)

首先就是OpenAI所提出的GPT相关模型,也是目前最火的大语言模型,发布版本已经到了4.0 1.ChatGPT 官网:https://chat.openai.com/chat 如下图是自然语言功能的使用示例 2.华为的盘古模型 盘古模型是华为开发的一系列大规模自回归中文预训练语言…

华为参战!国产之光盘古大模型推:盘古Chat

盘古Chat是华为基于盘古大模型开发的一款多模态千亿级大模型产品,可以支持多种自然语言理解和生成的任务,如文本生成、问答、翻译、对话等。它是直接对标目前比较火爆的ChatGPT的产品,被认为是新一代的国产“AI”王炸。 盘古Chat预计将于今…

华为云发布代码检查服务;微软向其美国雇员提供“无限制”休假时间;付费版 ChatGPT|极客头条...

「极客头条」—— 技术人员的新闻圈! CSDN 的读者朋友们早上好哇,「极客头条」来啦,快来看今天都有哪些值得我们技术人关注的重要新闻吧。 整理 | 梦依丹 出品 | CSDN(ID:CSDNnews) 一分钟速览新闻点&#…

大模型多模态Chatgpt+自动驾驶控制器设计方案

/导读/ 最近的科技圈,大家都被微软推出的ChatGPT刷屏,作为工智能公司OpenAI于2022年11月推出的聊天机器人,其能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,甚至能完成撰写邮件、视频脚本、文…

ChatGPT三问:是什么、从哪来、去往哪?

©PaperWeekly 原创 作者 | 张燚钧 单位 | 中国移动云能力中心 研究方向 | 预训练大模型 ChatGPT 热潮已经持续月余,目前热度依然不减。根据最新的消息,ChatGPT 的升级版 GPT-4 也已蓄势待发。回首 ChatGPT 的这波热潮,ChatGPT 是什么&a…

基于单机最高能效270亿参数GPT模型的文本生成与理解

作者:李鹏,王玮,陈嘉乐,黄松芳,黄俊 单位:阿里云智能机器学习平台PAI & 达摩院自然语言基础技术 概述 GPT模型能较好的处理文本生成领域的各种任务,比如文本补全,自由问答&am…

ChatGPT的因果关系基础:数据科学的实践与发展!

数据会说谎?如何正确的挖掘并使用数据? 前沿的科学实验如何做? 实验又是如何欺骗你的? ChatGPT等AIGC技术如何与因果学习双向赋能? 数据中台如何发挥功效? 用户增长有捷径吗? 数据科学的最佳实践…