2022的结尾,对话系统起飞了

8e11f67c2c90de1289f283c152e37a46.png

文 | 郑楚杰@知乎

编者记:近日来,ChatGPT的连续刷屏让人们重新看到了AI的希望,编者通过对ChatGPT的试用,发现其对话能力早已不同于两年前的对话系统了,可以说,有了质的飞跃,向着用户体验奇点迈进了一大步。本文就来跟随一位对话领域的大佬,一起了解下对话领域这两年是如何演变至今日的起飞的!

我是从 19 年开始做对话研究的。

根据我的感受,在 21 年之前,对话这块的风向一直是 Meta AI / FAIR 引领的,例如:人格化 (18)、知识性 (19)、共情性 (19)、一致性 (19)、安全性 (19)、反馈/终身学习 (19)、跨模态 (20)、长时记忆 (21)。

值得一提的是,他们一直在开源所收集的数据、所训练的模型。

从上面罗列的也可以看出,过去做对话的思路是从局部到整体,各个击破再加以整合。从今年 Meta AI 发布的 BlenderBot 3 和 CICERO 也能看出这一思路的影子

dd10986b0b4cf79dfd1ff9e88709bc1d.jpeg

BlenderBot 3 流程图,模块化搞起来

从今年(22年)开始,Google 的 LaMDA、DeepMind 的 Sparrow、OpenAI 的 InstructGPT 和 ChatGPT,其实换了不一样的思路:局部过于琐碎,直接一把梭。

与其由开发者为各个模块/技能点制定规范,不如由用户方给出指导和信号,这样训出来的模型更与用户需求 aligned。

甚至开发者都无需再了解「对话」这一场景的本质内涵(如前述的对话一致性),大力出奇迹但需要承认的是,这种粗粒度搞对话系统的方式需要基础模型足够强大,就像 ChatGPT 的基础模型 InstructGPT 在此前已经是地表最强了一方面,基础模型的能力是 ChatGPT 整套流程得以 work 的前提。

以 Meta AI 的 OPT 模型为例,虽然达到了与 GPT-3 同等的 175B 参数量,但生成能力仍然差很多,即使它用了 ChatGPT 的 demonstration data 训练,训出来的 policy 也不具备足够的泛化能力另一方面,很多文本生成的长尾/基础问题,如对话一致性、文本生成的连贯性和重复性等,会在高质量的预训练数据和 scaling 的作用下神奇地得到极大缓解。

这使得开发者无需再关注以往研究中的这些颇为头疼但又难以解决的问题,而只需要关注任务本身即可换句话说,其他的开发者即使有了 ChatGPT 的训练数据,也很难训出 ChatGPT 这样的效果,因为它们所立足的巨人的肩膀已经有着难以弥补的鸿沟了。

1e14c6ee15dddd53653322053f5d3277.jpeg

直接让用户示范「应该怎么做」、指导「怎么做更好」

另外,与 Meta AI(以及我组)不同的是,这些项目对对话系统的定位是功能性的 AI assistant,这抛弃了过去所突出的 human-like 或 personality,因此显然带有更原始的任务型对话系统的特征。

确切地说,它们是开放领域的任务型对话系统(不限任务范畴、任意输入形式),而非拟人化的闲聊机器人。

事实上,过于强调人格化也带来了许多安全隐患和伦理风险,侧重于功能性则带来更高的实用性。至于哪条道路才是未来,可能就见仁见智了。

f09e9fb53f8ee951797315ccff18ea7b.jpeg

DeepMind Sparrow 拒绝回答与人格相关的问题

当然,标数据必然花费了相当多的人力和财力(估计他们的标注质量比 Meta AI 一直采用的 AMT 标注要高得多),训大模型也需要庞大的算力。

这些项目的成功充分证明了钞能力的力量,作为护城河的数据更是不会开源了今年最大的感受是,通用领域的玩家下场搞垂直赛道真的是降维打击。

这也反映了以往对话领域的困境:令对话系统取得飞跃式进展的技术几乎都来自通用领域(大规模预训练、检索增强等),想搞真正有用的创新只能从数据层面入手。

当数据的优势也失去后,便难有招架之力了想到了 Jason Wei 大佬前阵子说的这段话(原 tweet 似乎被删了,可以辩证地看他的观点),做大模型能够带来很多全新的视角,就像 GPT-3、PaLM 已经是与 BERT、GPT-2 迥然不同的物种,就像 OpenAI 采用与过去不同的角度做了 ChatGPT。反倒是入场早的老玩家容易思路闭塞和脱节(敲响警钟)。

23706f45423c097ee68a27499094ad2c.jpege88a36f65de7d44b9083b9c4d6fe0085.jpeg

最后感慨一下,作为和 n+e 大哥同届本科的菜鸡,n 大哥已经开始改变世界了,而我还在挣扎于发论文毕业 :)

11d57f4e175fc01a7e4c0976b817e31c.jpeg后台回复关键词【入群

加入卖萌屋NLP、CV、搜广推与求职讨论群

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/23035.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

地表最强Code Interpreter与Midjourney联动,5分做出大片,网友称「GPT-4.5」来了!

夕小瑶科技说 分享 来源 | 新智元 Code Interpreter解禁后,可谓游戏规则的改变者。与Midjourney联动做大片,表情包生成,动嘴做表,各种潜能全被一众网友们挖掘出来了。 前段时间,GPT-4变笨引爆舆论,有人甚至…

OpenAI最强多模态语言模型来了:GPT-4发布

❤️觉得内容不错的话,欢迎点赞收藏加关注😊😊😊,后续会继续输入更多优质内容❤️ 👉有问题欢迎大家加关注私戳或者评论(包括但不限于NLP算法相关,linux学习相关,读研读博…

六足仿生机器人的控制与实现

目 录 摘 要 I Abstract II 1 文献综述 1 1.1 国外六足仿生机器人的发展情况 1 1.2 国内六足仿生机器人的发展情况 2 1.3 六足仿生机器人研究中存在的问题 2 1.4 六足仿生机器人的发展趋势 3 1.5 论文的主要内容 3 1.6 小结 4 2 六足仿生机器人的结构分析与步态规划 5 2.1 昆虫…

仿生蛇机器人

仿生类机器人 开头蛇形机器人研究意义结构分析生物结构分析 运动学分析 总结 开头 好久没写这个了,事情太多了,把这学期学的一些分享放上面。随便看看吧。仿生机器人是机器人的一个分支。相比于刚性齿轮结构和传动结构,一些动物的柔性结构使…

仿生水下航行器

仿生水下航行器 前面介绍的水下航行器的设计,大部分都是螺旋桨推进,虽然目前仍然广泛用于各种成熟的产品或者研发作品中,但是不得不承认的是螺旋桨在水下的推进的效率较低,对水下环境的扰动较大,不利于隐蔽&#xff0c…

仿生机器人

“仿生机器人”是指模仿生物、从事生物特点工作的机器人。当今世界,科技发展水平日益进步,机器人研究领域已经向航空航天、水面水下、地下管道等环境发展,未来的机器人将在人类无法工作的环境中代替人类工作,人们要求机器人不仅适…

仿生机器鱼设计

锐晶-Recrystal-重塑仿生机器人 欢迎进入Recrystal世界 分享在仿生机器鱼研制过程的一些心得与体会,最想与志同道合的朋友一起完成我们的梦想! 新的起点 机器鱼3D图,整个机器鱼外部结构件采用3D打印。 机器鱼3D图 舵机工作原理 机器鱼内…

仿生机器人研究

仿生机器人是指依据仿生学原理,模仿生物结构、运动特性等设计的机电系统,已逐渐在反恐防爆、太空探索、抢险救灾等不适合由人来承担任务的环境中凸显出良好的应用前景。 研制仿生机器人的灵感来源于自然界中的动物,比如蜥蜴是有着优秀运动能力…

计算机是仿生学,一种基于人体仿生学的计算机键盘的制作方法

本实用新型属于计算机键盘技术领域,具体涉及一种基于人体仿生学的计算机键盘。 背景技术: 键盘是最常用也是最主要的输入设备,通过键盘,可以将英文字母、数字和标点符号等输入到计算机中,从而向计算机发出命令和输入数…

蝴蝶优化算法

蝴蝶优化算法 算法简介香味具体算法 参考文献 群智能算法学习笔记 笔记内容和仿真代码可能会不断改动 如有不当之处,欢迎指正 算法简介 蝴蝶优化算法(butterfly optimization algorithm, BOA)是Arora 等人于2019年提出的一种元启发式智能算法。该算法受到了蝴蝶觅食…

仿生机器人知识体系

仿生机器人最核心的是模仿行为。 机器人控制算法 PID控制(比例积分微分控制) 根据给定值和实际输出值构成控制偏差,将偏差按比例、积分和微分通过线性组合构成控制量,对被控制对象进行控制。 ZMP零力矩点 判定仿人机器人动态…

字节跳动将双月OKR调整为季度;马斯克批OpenAI违背初心:被微软控制,只顾赚钱;苹果上新348元省电保护膜|极客头条...

「极客头条」—— 技术人员的新闻圈! CSDN 的读者朋友们早上好哇,「极客头条」来啦,快来看今天都有哪些值得我们技术人关注的重要新闻吧。 整理 | 梦依丹 出品 | CSDN(ID:CSDNnews) 一分钟速览新闻点&#…

BFT 最前线 | OpenAI开放网络浏览和插件;“360AI商店”上线;Bing市场份额不升反降;亚马逊机器人配送中心投产

原创 | BFT机器人 AI视界 TECHNOLOGY NEWS 01 OpenAI将向所有ChatGPT Plus用户推出网络浏览和插件 OpenAI将向所有ChatGPT Plus用户推出网络浏览和插件近日,OpenAI发文称,将在本周(5.15-5.21日)内向所有ChatGPT Plus用户推出网络…

LLMs开源模型们和数据集简介

本篇文章整理下目前常用的LLMs模型们和数据集简介。 BackBones ​https://github.com/FreedomIntelligence/LLMZoo 可以看到目前被广泛用来作为LLMs的backbone的模型有以下特点: Backbone:基于某个开源backbone,如GLM、LLaMA、BLOOMZ&#…

谷歌将推出新工具以识别虚假信息和AI生成内容;ChatGPT开放投资组合分析功能;网信办打击滥用AI虚拟主播等行为丨每日大事件...

‍ ‍数据智能产业创新服务媒体 ——聚焦数智 改变商业 企业动态 后摩智能发布存算一体智驾芯片鸿途H30 5月15日,后摩智能发布首款存算一体智驾芯片 —— 鸿途H30,最高物理算力256TOPS,典型功耗35W。鸿途H30基于SRAM存储介质,采用…

分享一个程序员接私活、兼职的平台

分享一个程序员接私活、兼职的平台 1、技术方向满足任一即可2、技术要求3、最后 1、技术方向满足任一即可 Python:熟练掌握Python编程语言,能够使用Python进行数据处理、机器学习和深度学习等相关工作。 MATLAB:熟练掌握MATLAB编程语言&…

最担心的还是发生了,程序员失业来得太突然!

周末我在后台收到一条私信,事情很有代表性,这里分享一下。 这位老哥在一家互联网头部公司做了 6 年的技术,最好的年纪都留在了这家公司。上个月底,赶上所在的部门重组。 公司动作很快,开完年中回顾会就裁掉了一批人&am…

猿如意初体验!赞一个。

目录 功能一:chatGPT 功能二、对 “效率工具”的试体验! 功能三:教程文档 最后总结 猿如意传送门猿如意下载地址:猿如意-程序员的如意兵器,工具代码,一搜就有 猿如意使用了几次了,今天来想分享一下我对于猿如意的…

如意如意猿如意

如意如意猿如意 什么是猿如意猿如意效率工具JSON编辑器jsontojava 开发工具ChatGPT 推荐指数评分及改进意见UI界面效率工具和开发工具ChatGPT一行代码 总结 经常听到一句话:如意如意随我心意,作为程序猿,我也想要一个如意,心中默念…

CSDN官方猿如意工具体验

2022年注定是不平凡的一年,2022再见,2023你好! 2023愿我们发财,被爱,一路好运常在!愿所念之人平安喜乐,所想之事顺心如意,岁岁常欢喜,万事皆胜意! 猿如意工具…