以 ChatGPT 为代表的「大模型」会是多大的技术革命?如果要发生技术革命需要具备哪些条件?...

AI大模型在具体场景下的多样价值

· AI大模型相当于是通过积累大量知识,最后形成的一个有泛化知识的个体。它跟原来传统意义上的小模型之间的差异,就相当于一个经过了大量通用题库训练的大学生,和一个只在特定专业受训练的技校生的差异。

  放眼整个AI大模型,不论是整体创建还是训练的成本都非常高,也是为什么国内外都是以研究院机构在主导技术推进。

· 自然语言处理(NLP)和计算机视觉(CV)这两块大模型是细分领域发展得最快的,技术上是因为相比其他情感或者逻辑推理等功能,结构更简单;应用上的原因主要是因为数据相对充分和廉价易得,大量的视频和文字资源可以近乎零成本扒取,另外也有直接可以应用的落地前景,比如对话系统推进系统、CV安防、智能产品的图像识别。

· 大模型的整体价值在于解决场景碎片化,在具体应用场景中,传媒影视用的比较多,做动漫游戏背景需要大量的素材,除了少部分核心的原画需要插画师创作,很多篇幅都可以通过机器生成;在科研领域,它也有可能驱动产生全新的研究范式,像生命科学以前基本上是靠纯手工的方法去做实验,现在结合大模型,演变出了干湿结合的新实验方法;智慧工业场景或者偏柔性的产线里也会产生各式任务和各种指标,像生产线传送带的温度、速度、压力以及生产数据本身,都可以通过大模型分析数据趋势,修正产线缺漏。

· 在产业端,大模型更像一种基础设施,达到一定规模后,它的重置成本就会非常高,如果最终只剩下少数几家取得优势地位的大模型供应商,并且在大多数行业上又有较好牵引力的话,那么就可能出现我们设想中的“AI超级大脑”。

· 眼下当务之急还是要找到更多行业结合点,让大家首先知道有大模型这种工具来尝试,现在陆陆续续有传统行业和互联网团队在积极对接了解大模型,这是好的信号。

HeptaAI(浙大HeptaAI Lab官方账号)回答:

技术革命在NLP界已经发生了,预计很快会影响到CV。以ChatGPT为代表的大模型将至少造成以下影响:

  1. 校设实验室向细或向空,公司实验室向大。校设实验室逐渐向大模型靠拢。由于训练资源不足,大量校设实验室将集中于prompt可解释性、即插即用方法、内部知识整合。训练资源尤其稀缺的校设实验室将集中在非常偏的任务。公司实验室会开始大模型竞争,RLHF的不同方向和规模将成为第一波low-fruit,外部知识整合会是第二波low-fruit。公司实验室的方法和参数保密性将进一步提升。公司实验室对系统架构和高效训练的人才的需求将迅速攀升。

  2. 小任务整合入大任务。大量小任务会并入大任务,构造有监督数据集并微调不再是小任务的第一选择。大模型无法取得好结果的小任务将成为研究热点。换句话说,研究热点将从“大模型能做到什么”转换为“大模型做不到什么”。

  3. 知识的挖掘和自监督学习成为NLP最前沿方向。大量基于RLHF的自监督基于知识的生成方法将被大实验室提出并实践,成果将大量发表在顶会。主流热点将主要focus在知识的数量、质量以及运用知识的方法。统计方法几乎完全取代规则方法,知识的地位将快速超越模型本身。这一浪潮将迅速影响到CV,今年必定有更多基于RLHF的CV方法发表于CV三大会。

  4. 资本变向,算法岗地位下降。资本将变向涌入大模型方向,未来数年会保持较高热度。公司将合并大量业务,竞争训练大模型以抢占市场。大数据工程师、后端工程师、架构师的地位提高,算法工程师地位进一步下降。

下面是写给从业者的建议。

如果你认真思考一下ChatGPT的架构,其实会发现ChatGPT无非就是微调的GPT-3,唯一的不同不过是知识的指向性,或者说模型对特定知识的筛选。GPT-3是用大量无指向性的非结构化文本训练的,而ChatGPT是在GPT-3的基础上用大量RLHF自监督的文本微调的。换句话说,知识才是ChatGPT优于GPT-3的关键。GPT-3的知识没有任何标签,因此本质是一个无监督学习;而ChatGPT使用RLHF生成符合人类指令要求的知识,因此本质是一个自监督学习。有了RLHF提供的监督信号,两个模型学习知识的质量就完全不同了。实验证明,使用质量高的知识,可以将GPT-3的模型规模压缩100倍。绕来绕去,NLG最后还是知识起了决定性作用。

想要在知识上做出创新,首先需要对NLG界中知识的演变做一个大致的了解。知识可以分为两种形式:内部知识(internal knowledge)和外部知识(external knowledge)。内部知识是从输入中获得的。例如,给定一串文本,内部知识就是这串文本隐含的topic、keyword等等。这串文本可以是一段summary,可以是一轮question-answering,甚至可以是一段对话(utterance+context)。外部知识是所有不能从输入中获得的知识,也就是在广泛的语料库中蕴含的知识。最简单的外部知识就是未被结构化的纯文本,例如小说、wikipedia、paper等。如果把纯文本结构化成知识库,知识就能被有效地组织起来。知识库其实就是一堆三元组,包括主谓宾。要构建知识库,可以人工标注三元组,也可以用大模型自动去打标签。形成知识库后,还可以用共享的主谓宾去做知识图谱,这样就可以运用各种各样的图算法了。其实ChatGPT和GPT-3都是运用大量的外部知识来提升生成的知识广度,而在内部知识上使用embedding一把梭,不考虑各种复杂的方法和指标。ChatGPT在生成回复后,会有reward model对输出进行打分,从而运用特定的外部知识;GPT-3在学习知识后不进行对输出的打分,直接进行推断,预训练时记住的外部知识成为生成的直接条件。换句话说,ChatGPT使用了“质量高”的外部知识。

知道了知识的分类,如何运用知识呢?最常用的知识整合方法还是attention,用dual encoder来fuse一个向量(一个输入文本的encoder,一个知识的encoder),此外还有用GNN来结构化句子。如果希望赋予OOV能力,可以加一个pointer network;如果希望赋予记忆能力,可以加一个memory network。

因此,从NLG界运用知识方式的发展的角度看:

  1. 外部知识的收集和整合的地位将迅速超越内部知识。

  2. 记忆方法如memory network将被attention取代,因为attention有能力记住far early内容。

  3. OOV方法如pointer network将被attention取代,因为大量外部知识可以消除OOV的现象。

  4. GNN等embedding方法可以用来整合入attention的embedding层,但价值大幅降低。

  5. 外部知识的质量监督的重要性将大幅超越知识的获取。

内容转载自知乎,著作权归属原作者,本文仅作学术分享,侵删

END

b8731c77418306595b6b9d2b226d01d3.png

推荐阅读

ChatGPT会取代搜索引擎吗?

全网唯一,不忽悠的ChatGPT

国内那么多AI专业,为什么国内却没有ChatGPT?

阻碍国内团队研究 ChatGPT 这样产品的障碍有哪些,技术,钱,还是领导力?

分享

收藏

点赞

在看

0eff438bbe21c00fce4ff12cf4855d82.gif

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/29375.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

元宇宙场景下的实时互动RTI技术能力构建

元宇宙可谓是处在风口浪尖,无数的厂商都对元宇宙未来抱有非常美好的憧憬。正因如此,许许多多厂商都在用他们自己的方案,为元宇宙更快、更好的实现,在自己的领域贡献力量。LiveVideoStack 2022北京站邀请到了 ZEGO 即构科技的解决方…

STM32的国产替代,盘点下我知道的国产MCU

电子元件涨价和缺货是多少嵌入式工程师的痛,一年内上游厂家晶圆产能告急能有数十次之多。而MCU更是重灾区,且不说国内有超75%的市场都是被国外产品占据,就是本国内的代理和供应商也是漫天要价,而交期更是长达7个月之久&#xff0c…

为什么说程序员做外包没前途?

之前做过不到3个月的外包,2020的第一天就被释放了,2019年还剩1天,我从外包公司离职了。我就谈谈我个人的看法吧。首先我们定义一下什么是有前途 稳定的工作环境 不错的收入 能够在项目中不断提升自己的技能(ps:非技术…

读南山耕夫笔记_5G QoS控制原理专题_基础概念

目录 引子 : 为什么要学习 5G QoS会话控制原理 ? 什么是理解技术原理 ? 整体流程 QoS Flow 的概念 基础概念 - 01 - pkt filter 相关 Packet Filter Set Flow Description Ethernet Flow Description Service data flow filter : sdf-filter , 业务数据流过滤器 Se…

wine - qq无法显示图片头像

来源:https://github.com/wszqkzqk/deepin-wine-ubuntu/issues/222 sudo gedit /etc/sysctl.conf在最下面添加 # IPv6 disabled net.ipv6.conf.all.disable_ipv6 1 net.ipv6.conf.default.disable_ipv6 1 net.ipv6.conf.lo.disable_ipv6 1 sudo sysctl -p 清缓存…

element-UI 使用icon图标或者avatar 头像不显示问题 解决

问题 昨天在写项目的时候,想用avatar 显示头像但是一直不能显示,但是能显示出地标的icon,当我用一模一样的代码使用user的icon的时候,发现又没有显示 跟官网对比了半天的代码发现并没有什么区别,并且有能实现出来的ico…

Android 头像定位图标

前言 相信很多小伙伴都使用过高德地图或者百度地图,其中肯定或多或少的会有通过头像定位图标显示用户位置的需求。比如类似于微信的位置共享或者到位App的用户位置显示。都是采取了通过头像合成头像定位图标的方式。其中可以在服务器上合成直接返回也可以在客户端上…

运用el-avatar显示图片/头像

Element-ui官方 实现 效果 代码实现 html <el-table-column label"头像" width"120"><div class"demo-fit"><div class"block"><el-avatarshape"square":size"50":fit"fit":src…

【uni-app】常用图标、头像汇总

在做小程序的时候&#xff0c;有时候需要各种图标和头像素材&#xff0c;而百度一堆基本都是收费的。所以&#xff0c;整理一些免费好用的图标&#xff0c;头像库&#xff1a; 1、iconfont-阿里巴巴矢量图标库 基本上常用的矢量图标&#xff0c;在这儿都有&#xff0c;而且可…

中学生鸿蒙系统演讲稿,华为鸿蒙 2.0 系统主题演讲公布,详细架构 9 月 11 日揭晓...

IT 之家 8 月 30 日消息 华为 9 月 10 日将举行华为开发者大会 2020&#xff0c;华为官网表示&#xff0c;" 我们将与您分享 HMS Core 5.0 最新进展&#xff0c; 揭开 HarmonyOS 和 EMUI 11 的神秘面纱。 振奋人心的新技术&#xff0c;深入的交流学习机会&#xff0c; 更灵…

[娱乐]华为HWT文件手动修改字体名称

前言 作为白嫖党&#xff0c;白嫖来的华为主题包里的字体&#xff0c;总是会出现一些导入后和显示的不太一样。 欲修改&#xff0c;遂有此文。&#xff08;又是逼死强迫症的一天/狗头保命&#xff09;&#xff08;免责声明&#xff1a;出了问题别找我&#xff0c;改回来就行&a…

华为电脑终于又能搭载正版 Windows 系统了!

整理 | 刘静 出品 | CSDN&#xff08;ID&#xff1a;CSDNnews&#xff09; 微软已经获得向华为出口软件的许可证 我们是否还停留在华为被美国列入“实体管制名单”的事件中&#xff1f; 然而就在2019年11月21日&#xff0c;据路透社报道&#xff0c;美国科技行业的“龙头老大”…

华为metebook 电脑应用市场应用无法下载

错误信息如下&#xff1a; 解决方案&#xff1a; 通过PC应用市场右上角下载列表 > 下载目录 > 右键点击AppGallery文件夹 > 属性 > 安全 > 查看当前文件夹是否有名为Authenticated Users的组或用户名 如果有组或用户名为Authenticated Users&#xff0c;请确…

协同办公“战役”,华为输了吗?

近日&#xff0c;华为“Link Now”APP发布停运公告&#xff0c;引发热议&#xff0c;宣布&#xff1a;自2022年12月16日24时起&#xff0c;Link Now业务将正式停止运营与服务。 作为值得尊重的民族企业&#xff0c;华为的一举一动&#xff0c;牵动着无数人的心。 Link Now是华…

华为鸿蒙主题设计,2020华为全球主题设计大赛,简直就是神仙打架啊!

#华为全球主题设计大赛# 是由华为主办的一场设计美学盛宴 本次大赛共收到来自 全球90个国家4.1万幅作品 用想象力构建出创意世界 专业组共四个单元 分为手机主题、创意壁纸、 个性表盘、城市画报 大众组手绘挑战赛 分为饭绘爱豆、二次元涂鸦、 手写壁纸、随便画4个话题 全球总冠…

2022年9月20日版华为主题工具更新讲解:锁屏代码机制的不同

2022年9月20日&#xff0c;华为主题官方工具发布更新&#xff0c;运行版本&#xff1a;11.0.14.301.0。 此次更新&#xff0c;锁屏代码有了全新调整。 动态锁屏原为manifest.xml一个文件。 而新工具&#xff0c;则会自动生成多个代码&#xff0c; <Lockscreen version"…

华为鸿蒙系统主题,华为鸿蒙2.0系统演讲主题公布:详细架构即将揭晓

华为即将于 9 月 10 日 -9 月 12 日举行华为开发者大会 2020&#xff0c;官网上已经公布的会议日程显示&#xff0c;这次大会主题有三大重点——鸿蒙系统、HMS 服务及 EMUI 11 系统。 华为官网表示&#xff0c;" 我们将与您分享 HMS Core 5.0 最新进展&#xff0c;揭开 Ha…

华为主题包hwt下载_华为主题开发工具

hwtTool免费版是一款由华为研发的主题制作程序&#xff0c;程序员能够通过它制作各种样式的主题或者视频壁纸&#xff0c;不管是锁屏的还是桌面主题&#xff0c;都可以用它来制作&#xff0c;就像我们在应用商店中看到的主题壁纸。 软件介绍 hwtTool(华为主题开发工具)是华为自…

华为电脑分类四个系列_华为正式推出“重新定义的个人电脑”,我们用四个问题阐述它是啥...

前言&#xff1a;2018年6月26日&#xff0c;华为官方正式宣布mate10系列正式支持升级云电脑功能&#xff0c;持有mate10系列手机的用户可以去华为应用商店下载安装。至此&#xff0c;前段时间华为宣布的“重新定义的个人电脑”正式和大家“见面”了。 对于华为官方的这一则消息…

ChatGPT请不要和打工人争辩今天星期几

目录 1 今天星期几2 聊聊ChatGPT与工具的结合 1 今天星期几 周五了&#xff0c;一个星期快结束了&#xff0c;闲来问问chatgpt (gpt-3.5) 今天 ( 2023.06.03星期五&#xff09;星期几&#x1f601;&#xff0c;chatgpt给出的回答如下&#xff1a; 今天是2023年6月2号没错&…