Prompt工程探索

在开源大模型LLaMA等成熟后,目前业界焦点在于:如何才能让 LLM 按照我们的要求去做,也就是prompt工程,设计产生大量prompt训练语料用于微调大模型

设计原则

首先要说的是设计原则,主要包含以下几个:

  • 清晰,切忌复杂或歧义,如果有术语,应定义清楚。
  • 具体,描述语言应尽量具体,不要抽象或模棱两可。
  • 聚焦,问题避免太泛或开放。
  • 简洁,避免不必要的描述。
  • 相关,主要指主题相关,而且是整个对话期间,不要东一瓢西一瓢。

生成策略

生成相关指令-斯坦福Alpaca self-instruct

https://www.toutiao.com/article/7210616578801533472/?app=news_article&timestamp=1678855351&use_new_style=1&req_id=2023031512423069CE4A3C83F23872EDE2&group_id=7210616578801533472&share_token=2EDD020F-68F0-42EC-BBBA-26BC4E8EAE16&source=m_redirect

Alpaca 使用 LLaMA 7B 模型的监督学习在 text-davinci-003 以 self-instruct 方式生成的 52K 指令遵循样本上进行微调。

Alpaca 的研究团队首先使用 self-instruct 种子集中的 175 个人工编写的指令输出(instruction-output)对,然后用该种子集作为 in-context 样本 prompt text-davinci-003 来生成更多指令。该研究通过简化生成 pipeline 改进了 self-instruct 方法,并显著降低了成本。

方法概览


 

指令模板

生成新指令的模板如下:

评估

在将 text-davinci-003 和 Alpaca 7B 进行 blind pairwise 比较之后,研究者发现这两个模型的性能非常相似,并且 Alpaca 略优于 text-davinci-003。

能生成大规模指令,但新指令的质量完全依赖于大模型的水平,实验中,Alpaca 还表现出语言模型的几种常见缺陷,包括幻觉、毒性和刻板印象,其中幻觉问题尤其严重。

生成同义指令-APE(Automatic Prompt Engineer)

https://m.thepaper.cn/baijiahao_20718621

研究者从 LLM 的三个特性入手。首先,使用 LLM 作为推理模型,根据输入 - 输出对形式的一小组演示生成指令候选。接下来,通过 LLM 下的每条指令计算一个分数来指导搜索过程。最后,他们提出一种迭代蒙特卡洛搜索方法,LLM 通过提出语义相似指令变体来改进最佳候选指令。

方法概览

步骤流程

下图为 APE 的执行过程。它可以通过直接推理或基于语义相似度的递归过程生成几个候选 prompt,评估其性能,并迭代地提出新的 prompt。

第一步:基于多个输入/输出示例让大模型预测指令

第二步:采用上步得到的预测指令作为新指令让大模型预测给出的输入对应的输出结果,并根据标准答案评分

第三步:对多个预测的指令按分数排序,去掉低分指令

第四步:(可选)通过大模型预测高分指令的同义指令

第五步:(可选)对同义指令让大模型预测给出的输入对应的输出结果,并根据标准答案评分

第六步:(可选)对多个同义指令按分数排序,去掉低分指令

评估

研究者还将 APE prompt 与 Lin 等人提出的人工 prompt 进行了对比。图 (a) 显示 APE 指令在所有三个指标上的表现都优于人工 prompt。图(b)显示了 truthfulness 和 informativeness 之间的权衡。

该方法仅适用于生成同义指令,应用范围有效,但用它来增强其他大模型的指令理解能力还是有效的

基于模板生成指令-面向信息抽取任务

https://zhuanlan.zhihu.com/p/615093883

最近有篇文章《Zero-Shot Information Extraction via Chatting with ChatGPT》很有趣,该工作将零样本IE任务转变为一个两阶段框架的多轮问答问题(Chat IE),并在三个IE任务中广泛评估了该框架:实体关系三元组抽取、命名实体识别和事件抽取。

方法概览

其实现基本原理为,通过制定任务实体关系三元组抽取、命名实体识别和事件抽取,并为每个任务设计了2个步骤的prompt-pattern,第一步用于识别类型,第二步用于识别指定类型的值。将抽取的任务定义(抽取要素)进行prompt填充,然后调用chatgpt接口,在取得结果后进行规则解析,结构化相应答案。

评估

适用于生成大规模信息抽取类指令,对大模型理解文本语义有价值

人工标注指令

https://baijiahao.baidu.com/s?id=1763047882981744476&wfr=spider&for=pc

根据 Databricks 首席执行官 Ali Ghodsi 的说法,虽然已有其他大模型可以用于商业目的,但「它们不会像 Dolly 2.0 那样与你交谈。」而且基于 Dolly 2.0 模型,用户可以修改和改进训练数据,因为它是在开源许可下免费提供的。所以你可以制作你自己的 Dolly 版本。

Databricks 发布了 Dolly 2.0 在其上进行微调的数据集,称为 databricks-dolly-15k。这是由数千名 Databricks 员工生成的超过 1.5 万条记录的语料库,Databricks 称这是「第一个开源的、人工生成的指令语料库,专门设计用于让大型语言能够展示出 ChatGPT 的神奇交互性。」

数据分布如下:

类型

占比

开放问答

24%

生成问答

14.6%

分类

14.2%

封闭问答

12.1%

头脑风暴

11.7%

信息抽取

10%

摘要

8.4%

改写

4.7%

参考

  • 收集了各种场景的模板指令 https://zhuanlan.zhihu.com/p/616393703
  • Dolly 2.0人工标注指令 https://baijiahao.baidu.com/s?id=1763047882981744476&wfr=spider&for=pc
  • Zero-Shot Information Extraction via Chatting with ChatGPT https://zhuanlan.zhihu.com/p/615093883
  • Automatic Prompt Engineer https://m.thepaper.cn/baijiahao_20718621
  • 斯坦福Alpaca self-instruct https://www.toutiao.com/article/7210616578801533472/?app=news_article&timestamp=1678855351&use_new_style=1&req_id=2023031512423069CE4A3C83F23872EDE2&group_id=7210616578801533472&share_token=2EDD020F-68F0-42EC-BBBA-26BC4E8EAE16&source=m_redirect
  • Prompt统一NLP新范式Pre-train, Prompt, and Predict 论文阅读:Prompt统一NLP新范式Pre-train, Prompt, and Predict - 知乎

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/22844.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

如何使用 ChatGPT 将任何数据格式导入 MySQL

ChatGPT 是 OpenAI 开发的强大语言模型,在各个领域都有广泛的应用,包括数据库开发。在本文中,我们将演示开发人员、DBA 和数据分析师如何利用 ChatGPT 的功能来增强向 MySQL 等数据库的数据导入。 如今,跨不同系统和格式的数据迁…

ChatGPT爆炸级更新,可以联网、使用插件进行交互

在几个月内ChatGPT一直处于科技热点的中心,并且放出了一个又一个大招,如GPT-4、深度融合进Office等等。前两天再次放出爆炸级更新--ChatGPT Plugins,让ChatGPT的躯体再次得到完善。 OpenAI将插件类比为ChatGPT的“眼睛和耳朵”,使…

ChatGPT王炸更新,插件系统上线!

Datawhale干货 最新:ChatGPT应用,来源:KiddoAI 文章编辑:Datawhale 这是一个"App Store"时刻 OpenAI今天宣布支持ChatGPT的新第三方插件,这个在网络上被热议的消息成真了!这相当于苹果的App Sto…

chatgpt赋能python:使用Python制作动画的步骤和工具

使用Python制作动画的步骤和工具 Python不仅是一种流行的编程语言,还可以用于制作动画。本文将介绍一些基本步骤和工具,帮助你制作出精美的动画作品。 步骤一:选择一个好的动画框架 Python有很多强大的动画框架可以使用。其中一些最受欢迎…

chatgpt赋能python:Python动画引擎:如何实现流畅的动画效果?

Python动画引擎:如何实现流畅的动画效果? Python动画引擎是一个强大的工具,可以帮助开发人员快速创建出令人惊叹的动画效果。它可以用于制作游戏、建筑模拟、数据可视化等场景中,为用户带来更好的交互体验。在这篇文章中&#xf…

chatgpt赋能Python-python_chia

简介:什么是Python Chia? Python Chia是一种加密货币,它的挖矿过程使用Python编程语言。Python Chia是开源的,任何人都可以参与挖矿。 Chia使用绿色挖矿的方式,这意味着Chia的挖矿过程对环境没有任何负面影响。此外&…

美赛C题纪实

提示:这篇是美赛结束发的!!!!!!!没有作弊,没有参考任何网上思路!!!!!仅为自己记录教训和为他人提供代码案例 文…

让ChatGPT做我的Java老师,他会怎么教我学习Java呢?

最近ChatGPT挺火的,突然想到一个有趣的玩法,ChatGPT如果来当老师,他会怎么教我学习java语言呢? 首先来看看ChatGPT认为熟练掌握java语言需要多长时间呢? ChatGPT认为熟练掌握java语言需要3-6个月。那我们就让他给我一份…

基于Android的应用市场软件的设计

基于Android的应用市场软件的设计 摘  要 随着智能手机的普及,人们越来越依赖手机进行一系列操作。 由于Android系统是一款免费的操作系统,导致了使用Android系统的手机占到7成左右。为了让Android手机用户体验更好,就需要让Android手机用户…

实际案例演示:从理论到实践,如何落地应用设计模式

大家在学习设计模式应该都会有个疑问,学完了。到底项目上怎么来用呢,好像没有思路。如果你也有这个疑问可以试试用chatgpt辅助你。不仅给了说明,还会给你提供代码demo,可以打开自己的思路。 以下就是详细的结果: 在开发Java版电子…

清华ACL 2023最新长文 | WebCPM:首个联网支持中文问答开源模型

2021年12月 WebGPT 的横空出世标志了基于网页搜索的问答新范式的诞生,在此之后,New Bing 首先将网页搜索功能整合发布,随后 OpenAI 也发布了支持联网的插件 ChatGPT Plugins。大模型在联网功能的加持下,回答问题的实时性和准确性都…

忆享聚焦|人工智能、元宇宙、云计算、5G基站…近期热点资讯一览

“忆享聚焦”栏目第十二期来啦!本栏目汇集近期互联网最新资讯,聚焦前沿科技,关注行业发展动态,筛选高质量讯息,拓宽用户视野,让您以最低的时间成本获取最有价值的行业资讯。 目录 行业资讯 1.ChatGPT火爆全…

中国开源项目迈向全球化!

整理 | 屠敏 出品 | CSDN(ID:CSDNnews) 中国开源正在登上全球化舞台,成为一股不容忽视的中坚力量。在国际开源领域,ant-design、vue-element-admin 等热门开源跻身前列;阿里巴巴、腾讯、华为、字节跳动、百…

大模型狂潮:各大厂纷纷亮剑,谁能笑傲江湖?

引言:四月AI大模型潮流来袭 假如我们站在未来回首往事,或许会惊讶地发现,这个春意融融的四月,竟是中国AI史上的一个重要节点。百度、阿里、腾讯、字节、商汤、京东、华为、360等科技巨头纷纷亮出底牌,推出各自的AI大语…

数据库领域3月大事件

本文整理2023年3月份最新数据库厂商、数据库领域的行业动态、以及各家云数据库厂商的产品动态。 本文主要整理了数据库领域的最新动态: 数据库厂商的重磅事件; 各数据库的产品更新。 一、重磅事件 ▋《数字中国建设整体布局规划》发布 近日,中…

GPT生成精美Echarts图表

【需求】:我想要用 echarts V5 来开发一个【柱状图表】 【输入文本】:我想用echarts开发一个【条形图】,目标帮我分析1-3天内每天访问我网站的用户数趋势,1-3天的用户数分别为20,50,60,请帮我生…

【花雕学AI】ChatGPT的50种神奇用法:让你的聊天更有趣,更有用,更有创意

【花雕学AI】是一个普通人学习AI的专栏(于2023年3月29日开始),由驴友花雕撰写,主要介绍了人工智能领域的多维度学习和广泛尝试,目前已包含七十多篇文章,分别介绍了ChatGPT、New Bing和Leonardo AI等人工智能…

AI 大战高考作文!实测 ChatGPT、文心一言、通义千问等 8 款“神器”

整理 | 郑丽媛 出品 | CSDN(ID:CSDNnews) 今天中午十一点半,2023 年高考作文题目火热出炉,其中全国甲卷作文题引人深思: 人们因技术发展得以更好地掌控时间,但也有人因此成了时间的仆人。 身处技…

chatgpt最强平替国内可用免费开源llama2模型下载使用

1,github下载llama2项目 打开下面的项目地址: GitHub - facebookresearch/llama: Inference code for LLaMA models 下载项目代码: GitHub - facebookresearch/llama: Inference code for LLaMA models 2,填写申请信息申请授权 https://…

探究 ChatGPT 4 的优势:基于 GPT-3.5 架构的大型语言模型

随着人工智能技术的不断发展,自然语言处理领域也取得了巨大的进展。其中,GPT(Generative Pre-trained Transformer)模型系列是自然语言处理领域的重要里程碑之一。而 ChatGPT 4 则是基于 GPT-3.5 架构的大型语言模型,相…