ChatGPT背后“推理”如何做?浙大等最新《基于语言模型提示的推理》综述,阐述大模型提示推理机制与方法体系...

5c39456af8ce805fcf9f3de9a4d1ac44.png

来自:专知

进NLP群—>加入NLP交流群

作为解决复杂问题的基本能力,推理可以为各种实际应用提供后端支持,如医学诊断、谈判等。本文对语言模型提示推理的前沿研究进行了全面概述。我们介绍了研究成果的对比和总结,并为初学者提供了系统性的资源。我们还讨论了这种推理能力出现的潜在原因,并强调了未来研究的方向。

1. 引言

推理能力是人类智能的核心,然而在自然语言处理(NLP)领域,现代神经网络很难从所告知或已知的信息中进行推理(Duan 等,2020;Wang 等,2021;Bhargava 和 Ng,2022)。幸运的是,zhe(Brown 等,2020;Chen 等,2021;Chowdhery 等,2022),扩大语言模型(LMs)的规模已经被证明可以赋予一系列推理能力,如算术推理(Wang 等,2022e;Lewkowycz 等,2022)、常识推理(Jung 等,2022;Liu 等,2022b)和符号推理(Zhou 等,2023;Khot 等,2023)。如图 1 所示,这种能力可以通过提示策略(Liu 等,2022d)(如思维链提示(CoT)(Wei 等,2022b),生成知识提示(Liu 等,2022c))来解锁,从而大大缩小人类与机器智能之间的差距。同样,NLP领域有大量的工作被提出;然而,这些方法分散在各种任务中,并未得到系统的回顾和分析。

479d87a99615e938240a96d3647cbd73.png

本综述组织:在本文中,我们进行了第一次关于语言模型提示推理的最近进展调查。我们首先介绍这个方向的一些初步内容(§2),然后建议按照分类法组织相关工作(§3)。我们进一步提供深入的比较和讨论以获得洞察力(§4)。为了方便对这个领域感兴趣的初学者,我们强调了一些开放资源(§5)以及潜在的未来发展方向(§6)。

为了提高语言模型提示的推理能力,研究主要有两个分支。第一个分支专注于优化提示推理策略,如图 2 所示,包括提示工程(§3.1.1)、过程优化(§3.1.2)和外部引擎(§3.1.3)。

在提示工程(§3.1.1)中,许多方法试图提高提示 T 的质量,我们称这些工作为单阶段方法;而其他方法在每个推理阶段将 ci 添加到(T ,Q)的上下文中,或为每个 ci 设计特定的 Tci ,我们将这些方法视为多阶段方法。需要注意的是,这里的一个阶段是指一个输入输出过程。对于过程优化(§3.1.2),最简单的方法是引入带有参数θ的优化器,用于在生成A时校准C,我们称这些工作为自优化方法。另一些方法尝试获得多个过程来得到最终的答案组合,我们将这些工作视为集成优化方法。此外,整个优化过程可以通过对生成的三元组(Q,C,A)进行微调 pLM 迭代地集成,这被视为迭代优化方法。此外,一些工作利用外部推理引擎(§3.1.3)生成 T ,直接执行 C 或通过在 C 中植入工具 API 调用进行推理。研究的第二个分支重点关注提示的知识增强。需要注意的是,LM 中丰富的隐式“模型知识”(Han等人,2021)可以生成知识或基于知识的提示 T(§3.2.1)。同时,外部资源中的显式知识也可以被利用并检索为知识性提示,以增强推理(§3.2.2)。

3. 方法体系

在本文中,我们调研了现有的基于语言模型提示的推理方法,并将它们归类为策略增强推理(§3.1)和知识增强推理(§3.2)。如图2所示,我们根据不同方法的独特特征进一步细化它们

3.1 策略增强推理

这方面工作的主要目的是设计更好的推理策略,具体体现在提示工程(§3.1.1)、流程优化(§3.1.2)和外部引擎(§3.1.3)中。

3.1.1提示工程

一种改进提示推理的直观方法是提示工程。如图3所示,我们根据提示阶段的数量将这种方法分为单阶段提示和多阶段提示。

c853aad73f657d300a3e67b58096244a.png

3.1.2 流程优化

自然语言理据(Ling et al., 2017a),也称为CoT中的推理过程,在CoT提示中起着至关重要的作用(Ye and Durrett, 2022;Lampinen等人,2022;Min et al., 2022)。推理过程的一致性(Wang et al., 2022e)和推理步骤之间的连续性(Li et al., 2022d)都会影响最终答案的准确性。直观地,如图4所示,我们将这一行方法分为三种类型,即自优化、集成优化和迭代优化。

5fd7e9328722f14f0eea6a4c7785ba60.png

3.1.3 外部引擎

在LM提示下进行推理时,模型应具有语义理解(如问题)和复杂推理(如通过生成推理过程)的能力;然而,我们不能同时拥有鱼和熊掌(Hendrycks等人,2021;Nogueira等人,2021;Lewkowycz等人,2022)。为了打破这个障碍,外部推理引擎可以帮助语言模型(见图5)。

8c7519248b5a32749431ceaa8b82799e.png

3.2 知识增强推理

正如Manning(2022)所指出的,知识在AI推理系统中起着至关重要的作用。知识增强方法旨在用隐式(§3.2.1)或显式(§3.2.2)知识提示语言模型,以协助推理(见图6)。

10ca742217611305cf8c121ebecd0335.png

3.2.1 隐式知识 

研究人员已经证明,语言模型中包含大量的隐式知识(Davison等人,2019;Petroni等人,2019;Jiang等人,2020)。以下工作试图将这种“模型知识”引入作为知识提示进行推理。刘等人(2022c)使用少量提示的 GPT-3(Brown 等人,2020)生成知识并提示下游 LM。刘等人(2022b)借助强化学习(Schulman等人,2017)进一步校准知识。与在知识生成阶段使用少量提示的方法不同,孙等人(2022)提出了一种两阶段生成提示,其中还包括答案生成提示。其他工作(李等人,2022b;王等人,2023;Shridhar等人,2022;Magister等人,2022;何等人,2022)遵循知识蒸馏,通过提示更大的 LM 生成推理样本并教授较小的 LM。

3.2.2显性知识

尽管大型语言模型已显示出强大的生成能力(Wiegreffe等人,2022;Li等人,2022b;Wang et al., 2023),他们仍然有幻觉事实的倾向(Rohrbach等人,2018)和产生不一致的知识(Liu et al., 2022b)。最近的工作表明,在上下文学习中检索提示是取得良好性能的一种很好的方法(Liu等人,2022a;Rubin等人,2022)。由于常用检索方法在度量结构化信息相似性方面的不稳定性,Lu等人(2023b)提出了一种基于策略梯度策略的动态提示检索方法,无需暴力搜索。SU等人(2023)制定了一个选择性的标注框架,以避免对大型标注检索语料库的需求。He et al.(2023)根据CoT的推理步骤检索相关知识,以提供更可靠的解释。Trivedi等人(2022)通过持久检索wiki文档来增强CoT提示,用于需要复杂的多步骤推理的开放域知识密集型任务。

b36f935cea63ea90b5bd43e52c955942.png

4 比较与讨论

表1显示了不同方法的四种比较范围。图7进一步说明了不同规模的语言模型在算术推理的GSM8K (Cobbe等人,2021)上的性能比较。常识推理基准的类似结果见附录A.3。模型规模较大的语言模型包含更多用于推理的隐性知识(Liang等人,2022b)对代码分支进行预训练,不仅可以增强代码生成/理解能力,还可以激发CoT的推理能力。.输入上下文中包含的高质量推理依据是LM提示推理的关键。

cadb9ce5bdc0f71d6c92b274e3a6eaca.png

基于语言模型提示的推理分类。

5. 未来的发展方向

我们列出了一些潜在的方向如下:

    • ‍推理的理论原理。

    • 高效的推理。

    • 鲁棒的、可靠的和可解释的推理

    • 多模态(交互式)推理。

    • 可泛化(真)推理。

6. 结论

本文对语言模型提示推理进行了综述,包括全面的比较,以及几个研究方向。展望未来,来自NLP和其他领域的方法之间将有更有效的协同作用,并希望复杂和高效的LM提示模型将越来越多地为提高推理性能做出贡献。

进NLP群—>加入NLP交流群

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/12941.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

笔精墨妙,妙手丹青,微软开源可视化版本的ChatGPT:Visual ChatGPT,人工智能AI聊天发图片,Python3.10实现

说时迟那时快,微软第一时间发布开源库Visual ChatGPT,把 ChatGPT 的人工智能AI能力和Stable Diffusion以及ControlNet进行了整合。常常被互联网人挂在嘴边的“赋能”一词,几乎已经变成了笑话,但这回,微软玩了一次真真正…

ChatGPTBox 沉浸式的感受ChatGPT带来的快感

ChatGPT基础功能: 1.自然流畅的对话:ChatGPT通过对海量对话数据的学习,具有自然流畅的对话能力,能够与用户进行逼真的自然语言交互。 2.能够理解语境:ChatGPT能够理解语境,不仅能根据上下文生成回答&…

【社区图书馆】你好,ChatGPT

ChatGPT,一款基于GPT-3.5架构的大型语言模型,可以提供广泛的知识和信息。在这篇文章中,我将介绍一些关于ChatGPT的背景、功能和使用方式的信息。 作为一款AI语言模型,ChatGPT可以像人类一样理解和处理自然语言。ChatGPT被设计用来…

OpenAI官方提示词课(二)迭代提示词

当我们在调试程序时,通常很难一次就把程序正常跑起来。这是普遍现象。但我们会借助一些工具和手段,有步骤有流程地去调整程序,最终让程序按照我们想要的样子正常执行。 对于提示词来说也是一样的。当我们向ChatGPT提问时,一开始它…

如何用自己公司的知识、流程等来训练Chat GPT?

在玩过 ChatGPT 并向它询问有关世界、金融和初创公司的一般问题后,我开始思考:“如果我可以用我自己的初创公司甚至大型公司的所有流程、知识和商业经验来训练 AI 模型会怎样?企业?” 使用您自己公司的知识、流程等培训 ChatGPT …

上班摸鱼!如何让ChatGPT帮我们做测试!

作为软件开发领域中至关重要的一环,软件测试的重要性日益凸显。然而,随着软件测试开发技术的不断发展,软件测试也面临着越来越多的挑战,为了更好地应对这些挑战,测试人社区将持续举办技术沙龙活动,为测试人…

ChatGPT的技术发展路径和带来的影响

ChatGPT一经推出,在业界引起巨大轰动,国内外各大厂商纷纷布局相关业务。元宇宙与生成式模型相辅相成技术互相促进,元宇宙能够实现线上化服务入口的行业,在元宇宙中进行场景融合,chatGPT能助力元宇宙场景生成与智能交互…

人工智能轨道交通行业周刊-第43期(2023.4.24-5.7)

本期关键词:综合智能检测、隧道检测、智慧城轨白皮书、虚拟编组、讯飞星火大模型、央企数字化 1 整理涉及公众号名单 1.1 行业类 RT轨道交通人民铁道世界轨道交通资讯网铁路信号技术交流北京铁路轨道交通网上榜铁路视点ITS World轨道交通联盟VSTR铁路与城市轨道交…

ChatGLM-6B does not appear to have a file named config.json.

文章目录 代码调用演示效果实例一、问题二、场景说明三、error说明四、解决解决一解决二 ChatGLM-6B是一个由清华大学和智谱AI联合研发的开源对话语言模型。它是一个支持中英双语问答的对话系统,并在中文方面进行了特别的优化。 该模型基于General Language Model (…

AttributeError:‘list’对象没有属性’endswith’ (AttributeError: ‘list’ object has no attribute ‘endswith’)

文章目录 代码调用演示效果实例问题场景描述解决方法一方法二 ChatGLM-6B是一个由清华大学和智谱AI联合研发的开源对话语言模型。它是一个支持中英双语问答的对话系统,并在中文方面进行了特别的优化。 该模型基于General Language Model (GLM)架构,具有6…

ChatGPT 联网后,屏障被打破了!

引语:大家好我们是权知星球,开启你独特的知识星际之旅ChatGPT在一夜之间完成了“进化”,通过插件功能实现了联网,并开启了自己的“AppStore”时代。 目录 ChatGPT进入“AppStore”时代 获取最新资讯 运行插件并代表用户执行操…

怎么把文字转换成朗读,快来看这几款文字转语音朗读工具

在日常的生活中,我们经常会遇到将文字转换成语音的情况,比如自制有声小说、给视频配音等等,当然我们还会自己手动进行配音。但是如果没有专业的设备和配音环境,是很难配出很好的效果,那该怎么办呢?其实也不…

微信新增文章朗读功能;超越 ChatGPT 记录,Threads 上线 5 天用户破亿;在删除数据前如何通知客户|极客头条...

「极客头条」—— 技术人员的新闻圈! CSDN 的读者朋友们早上好哇,「极客头条」来啦,快来看今天都有哪些值得我们技术人关注的重要新闻吧。 整理 | 梦依丹 出品 | CSDN(ID:CSDNnews) 一分钟速览新闻点&#…

语音朗读2.0

效果图&#xff1a; 上代码&#xff1a; <!DOCTYPE html> <html><head><meta charset"UTF-8"><title>语音朗读测试</title><script src"http://libs.baidu.com/jquery/2.0.0/jquery.min.js"></script>&l…

OpenAi使用心得(注册+聊天+CodeX+图片+对接api)

OpenAi使用心得&#xff08;注册聊天CodeX图片&#xff09; 点击直接对话&#xff1a;慧言公益GPT 一、聊天功能&#xff1a; 二、 CodeX&#xff08;白话文编码&#xff09; 这里直接录了个ai写网页的视频 成品展示&#xff1a;成品 三、图片生成功能 输入关键词即可直接生…

iPhone游戏 Fragger 扔手雷 通关

这个小游戏我觉得根愤怒的小鸟有的一拼,而且它的操作方式又很类似早期的PC网络游戏疯狂坦克. 我在疯狂坦克中的排名是1000以内,所以我是金牌,玩这个游戏又找到了当年的感觉. 以图片记录一该游戏中的关卡,个人觉得它们都是不错的设计. 转载于:https://www.cnblogs.com/ioriwell…

【扫雷游戏】(可展开,可标记)

文章目录 引言游戏规则代码实现主程序游戏程序初始化打印棋盘布雷排雷统计周围雷的个数&#xff01;递归展开&#xff01;标记判断输赢 运行展示代码展示总结 引言 对于上面的图&#xff0c;相信大家不会陌生&#xff0c;它是于1992年发行的一款风靡全球的益智小游戏。游戏目标…

扫雷游戏初步实现与心得

一. 1.老规矩&#xff0c;扫雷游戏也是用模块化加自定义函数实现&#xff0c;也是先写出一个大概框架与流程&#xff0c;前期实现可以看我三子棋的博文 http://t.csdn.cn/uMeOc &#xff0c;因为是上来就要打印菜单&#xff0c;所以使用do while循环 void menu() {printf(&q…

微信ipad协议GO版本 最新不封号

支持A16&#xff0c;62数据号登录 支持扫码登录 全新支持短信号登陆&#xff0c; 长链接不掉线&#xff0c;稳定不封号 支持获取小程序code 抢购 游戏试玩授权等 getLoginQRCode (获取登录二维码) CheckLoginQRCode(检测扫码状态) ManualAuth(扫码登录) ManualAuth(62数据…

pygame8 扫雷游戏

一、游戏规则&#xff1a; 1、点击方格&#xff0c;如果是地雷&#xff0c;游戏失败&#xff0c;找到所有地雷游戏胜利 2、如果方块上出现数字&#xff0c;则表示在其周围的八个方块中共有多少颗地雷 二、游戏主逻辑&#xff1a; 主要逻辑即调用run_game, 然后循环检测事件…