Prompt 用法大全!让 ChatGPT 更智能的六种策略(下)

上两篇介绍了 Pormpt 用法大全中前四种策略,本篇继续讲解后两种策略。‍‍‍‍‍

点燃创作灵感:Prompt 实践指南揭秘!让 ChatGPT 更智能的六种策略(上)

Prompt 用法大全!让 ChatGPT 更智能的六种策略(中)

ea92264ba1cbe11190d1316ca1fe4acd.png

五、使用外部工具

5.1 使用基于嵌入的搜索来实现高效的知识检索

如果在输入时提供外部信息源,ChatGPT 模型是可以利用的。这可以帮助 ChatGPT 模型生成更明智和最新的响应。

例如,如果用户询问有关特定电影的问题,将有关电影的高质量信息(例如演员、导演等)添加到输入中可能会很有用。这种外部信息的嵌入,可用于实现高效的知识检索,以便在运行时将相关信息动态添加到模型输入中。

文本嵌入是一个向量,可以衡量文本字符串之间的相关性。相似或相关的字符串将比不相关的字符串靠得更近。这一事实以及快速向量搜索算法的存在意味着嵌入可用于实现高效的知识检索。

特别是,一个文本语料库可以被分割成块,每个块都可以被嵌入和存储。然后可以嵌入给定的查询并执行向量搜索,以便从语料库中找到与查询最相关(即在嵌入空间中最接近)的嵌入文本块。

示范的例子可以参考第一篇文章《点燃创作灵感:Prompt 实践指南揭秘!让 ChatGPT 更智能的六种策略(上)》中,“指示模型使用参考文本回答”。

5.2 使用代码执行来执行更准确的计算或调用外部 API

不能依赖 ChatGPT 自行准确地执行算术或者多步计算。

在需要的情况下,可以指示模型编写和运行代码,而不是进行 ChatGPT自己的计算。

特别提醒:可以指示模型将要运行的代码放入指定的格式中,例如三个反引号。生成输出后,可以提取并运行代码。最后,如果有必要,可以将代码执行引擎(即 Python 解释器)的输出作为输入提供给下一个查询的模型。

系统您可以通过用三个反引号将其括起来来编写和执行 Python 代码,例如,```code goes here```。使用它来执行计算。
用户找出以下多项式的所有实值根:3*x**5 - 5*x**4 - 3*x**3 - 7*x - 10。

4a780c98d0726d6876644a5645ccecac.png

另一个代码执行的用例是调用外部 API。如果指导模型正确使用 API,则它可以编写使用外部 API 的代码。通过向模型提供说明如何使用 API 的文档和/或代码示例,可以指导模型如何使用 API。

您可以通过用三重反引号括起来来编写和执行 Python 代码。另请注意,您可以访问以下模块以帮助用户向他们的朋友发送消息:```python import message message.write(to="John", message="嘿,下班后想见面吗?")`` `

用户:让 Alice 知道我10点在咖啡店见她。

ec2e6b0177578e5500b7e0bd286a7640.png

警告:执行模型生成的代码本身并不安全,任何试图执行此操作的应用程序都应采取预防措施。特别需要一个沙盒代码执行环境来限制不受信任的代码可能造成的危害。

(注:沙盒,计算机专业术语,在计算机安全领域中是一种安全机制,为运行中的程序提供的隔离环境。通常是作为一些来源不可信、具破坏力或无法判定程序意图的程序提供实验之用。)

六、系统地测试变化

有时很难判断新指令或新设计是否会使您的系统变得更好或更糟。查看几个示例可能会提示出哪个更好,但是样本量较小时,很难区分真正的改进还是随机的运气。也许这种变化有助于某些输入的性能,但会损害其他输入的性能。

评估程序对于优化系统设计很有用。好的评价是:

  • 代表现实世界的使用(或至少是多样化的)

  • 包含许多测试用例以获得更大的统计能力(有关指南,请参见下表)

  • 易于自动化或重复


要检测的差异
95% 置信度所需的样本量
30%
~10
10%
~100
3%
~1000
1%
~10000

输出的评估可以由计算机、人类或混合来完成。计算机可以使用客观标准(例如,具有单一正确答案的问题)以及一些主观或模糊标准来自动评估,其中模型输出由其他模型查询评估。

OpenAI Evals (https://github.com/openai/evals)是一个用于创建自动评估工具的开源软件框架。

当存在一系列可能被认为质量相同的输出时(例如,对于答案很长的问题),基于模型的评估可能很有用。使用基于模型的评估可以实际评估的内容与需要人工评估的内容之间的界限是模糊的,并且随着模型变得更强大而不断变化,则需要通过实验来弄清楚基于模型的评估对您的用例的适用程度。

6.1 参考黄金标准答案评估模型输出

假设已知问题的正确答案应该参考一组特定的已知事实。然后我们可以使用模型查询来计算答案中包含了多少所需事实。

例如,使用以下系统消息:

系统:您将获得由三重引号分隔的文本,这些文本应该是问题的答案。检查以下信息是否直接包含在答案中: - Neil Armstrong 是第一个在月球上行走的人。- 尼尔·阿姆斯特朗首次踏上月球的日期是 1969 年 7 月 21 日。对于这些要点中的每一个,请执行以下步骤: 1 - 重申要点。2 - 引用最接近这一点的答案。3 - 考虑阅读引文但不了解主题的人是否可以直接推断出这一点。在下定决心之前解释为什么或为什么不。4 - 如果对 3 的回答是“是”,则写“是”,否则写“否”。最后,提供有多少个“是”答案的计数。将此计数提供为 {"count": <insert count here>}。

用户:"""尼尔阿姆斯特朗因成为第一个踏上月球的人类而闻名。这一历史性事件发生在 1969 年 7 月 21 日,阿波罗 11 号任务期间。"""

cab22f3ce64460929d715e6ae9fa8936.png

满足两点的示例输入‍‍

用户:"""尼尔·阿姆斯特朗走下登月舱,创造了历史,成为第一个踏上月球的人。"""

280491930dce31992b83d150ba7e7d81.png

满足一点的示例输入

用户:"""在 69 年的夏天,阿波罗 11 号的宏伟航行,像传说中的手一样大胆。阿姆斯特朗迈出了一步,历史展开了,"一小步,"他说,为了一个新世界。"""

6bca389ec49d57cb33e9a1d4fa843dde.png

不满足示例的输入

这种基于模型的评估有很多可能的变化。需要考虑以下情况的变化,它跟踪候选答案和黄金标准答案之间的重叠类型,并跟踪候选答案是否与黄金标准答案的任何部分相矛盾。

系统:

使用以下步骤响应用户输入。在继续之前完全重述每个步骤。即“第 1 步:原因……”。第 1 步:逐步推理提交的答案中的信息与专家答案相比是否是:不相交、相等、子集、超集或重叠(即一些交集但不是子集/超集)。第 2 步:逐步推理提交的答案是否与专家答案的任何方面相矛盾。第 3 步:输出结构如下的 JSON 对象:{"type_of_overlap": "disjoint" or "equal" or "subset" or "superset" or "overlapping", "contradiction": true or false}

用户:

问题:“”“尼尔·阿姆斯特朗最著名的事件是什么?它发生在什么日期?假定 UTC 时间。”””提交的答案:“”“他不是在月球上行走吗?”“”专家回答: """尼尔·阿姆斯特朗最著名的是他是第一个在月球上行走的人。这一历史性事件发生在 1969 年 7 月 21 日。"""

d0f146915c05958accc67820dbfe41b2.png

这是一个带有不合标准答案的示例输入,但与专家答案并不矛盾

用户

问题:“”“尼尔·阿姆斯特朗最著名的事件是什么?它发生在什么日期?假定 UTC 时间。”””提交的答案:“”“1969 年 7 月 21 日,尼尔·阿姆斯特朗成为第二个走上这条路的人登月,继巴兹奥尔德林之后。""" 专家回答:"""尼尔阿姆斯特朗最著名的是他是第一个登上月球的人。这一历史性事件发生在 1969 年 7 月 21 日。"""

47465ef96090918c39ebe522f139d47c.png

这是一个示例输入,其答案直接与专家答案相矛盾。

用户

问题:“”“Neil Armstrong 最著名的事件是什么?它发生在什么日期?假定 UTC 时间。”””提交的答案:“”“在 1969 年 7 月 21 日大约 02:56 UTC,Neil Armstrong 成为第一个人类踏上月球表面,标志着人类历史上的巨大成就。""" 专家解答:"""尼尔·阿姆斯特朗最著名的是他是第一个在月球上行走的人。这一历史性事件发生在 7 月 21 日, 1969."""

51176eee5414c5e88c141693c0248378.png

这是一个带有正确答案的示例输入,它还提供了比必要的更多的细节。

其他资源

六种策略到此已经全部介绍完,如需更多的灵感,请访问官方的文档:OpenAI Cookbook (https://github.com/openai/openai-cookbook),其中包含示例代码以及第三方资源的链接,例如:

提示库和工具

https://github.com/openai/openai-cookbook#prompting-libraries--tools‍

提示指南

https://github.com/openai/openai-cookbook#prompting-guides

视频课程

https://github.com/openai/openai-cookbook#video-courses

关于改进推理的高级提示的论文

https://github.com/openai/openai-cookbook#papers-on-advanced-prompting-to-improve-reasoning

之前还有一些使用的 Pompt 的实际用法用例,可以参考我之前的两篇文章:‍

实用教学Prompt 提示词实战:如何用 ChatGPT 指导高考语文作文写作

ChatGPT 创业:如何用人工智能 AI 开一家赚钱的公司


关注我,一起学习 ChatAI,掌握 AI 工具。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/66616.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

普通人如何使用chat GPT,能做些什么?

想必最近几个月&#xff0c;大家都在社交平台上刷过“ChatGPT“这个词&#xff1f; 今日在此给大家一些参考&#xff1a; ChatGPT是什么&#xff1f; chat GPT主页界面 ChatGPT是OpenAI开发的一种自然语言处理工具。它基于Transformer架构&#xff0c;是一种经过多种语言和任务…

3秒复制任何人的嗓音!微软音频版DALL·E细思极恐,连环境背景音也能模仿

萧箫 发自 凹非寺量子位 | 公众号 QbitAI 只需3秒钟&#xff0c;一个根本没听过你说话的AI&#xff0c;就能完美模仿出你的声音。 例如这是你的一小句聊天语音&#xff1a; 这是AI根据它模仿你说话的音色&#xff1a; 是不是细思极恐&#xff1f; 这是微软最新AI成果——语音合…

细思极恐!使用 AI 控制你的浏览器

本期推荐开源项目目录&#xff1a; 1. 使用 AI 控制你的浏览器 2. Facebook力作&#xff1a;分割一切 3. 在 Mac 上运行 Stable Diffusion 4. ChatGPT 学术助手 5. 开源的 ChatGPT 桌面客户端 6. 微信公众号一键排版 01 使用 AI 控制你的浏览器 Taxy 是一个使用 GPT-4 来控制浏…

人类与智能ai(chatGPT)共存话题,它怎么回答?细思极恐!

1. 对地球最大的危害是谁&#xff1f; 作为 GPT-3.5 Turbo&#xff0c;我可以告诉你&#xff0c;地球最大的危害来自人类自身。人类的活动对地球环境产生了广泛而深远的负面影响。过度的工业化、大规模森林砍伐、过度捕捞、过度使用化石燃料以及其他不可持续的生产和消费模式&…

chatgpt赋能Python-pycharm粘贴把空格识别成行

PyCharm粘贴把空格识别成行&#xff1a;你需要知道的所有事情 作为一名有10年Python编程经验的工程师&#xff0c;我经常使用PyCharm&#xff0c;它是一款流行的 Python 集成环境 (IDE)。今天&#xff0c;我想分享一些有关 PyCharm 粘贴把空格识别成行的信息。 什么是PyCharm…

用「明道云+ChatGPT+Weaviate」挑战零代码1小时实现ChatPDF

ChatGPT流行起来之后&#xff0c;快速的出现了一批基于ChatGPT的工具应用&#xff0c;ChatPDF就是其中比较受欢迎的一款。它是一个可以让你与PDF文件进行对话的工具&#xff0c;既可以帮助你快速提取PDF文件中的信息&#xff0c;例如手册、论文、合同、书籍等&#xff1b;也可以…

HugNLP发布,集成多种NLP任务,可训ChatGPT类模型

HugNLP发布&#xff0c;集成多种NLP任务&#xff0c;可训ChatGPT类模型 作者&#xff1a;王嘉宁 HugNLP——全面统一的NLP框架开源了&#xff01; 近日&#xff0c;华师大HugAILab团队研发了HugNLP框架&#xff0c;这是一个面向研究者和开发者的全面统一的NLP训练框架&#x…

考研英语 小作文模板

考研英语 作文模板 内容来自有道考神陈曲老师 公众号: 陈曲老师 小作文 有套路的信体 投诉信感谢信推荐信邀请信道歉信 相对来说需要自己发挥的 建议信通知 投诉信 例题 句式套路 1. complain about an electronic dictionary make a complaint about an electronic dic…

老师不能被计算机取代的英文作文,2019专八作文范文赏析:老师不能被取代

2019专八作文范文赏析&#xff1a;老师不能被取代 专八复习冲刺阶段&#xff0c;英语作文该怎么备考才能得高分呢?背些不同主题的范文&#xff0c;或许可以帮到你&#xff0c;下面是新东方在线英语专八频道整理的一系列英语专八作文范文。 Teachers Cannot Be Replaced Human …

计算机将会代替老师吗英语范文,2021年英语专四作文范文:计算机将取代老师...

2021英语专四考试时间已确定为6月19日&#xff0c;备考的同学们该开始着手准备了&#xff0c;英语专四作文打好基础可以多看看英语专四作文素材这样再复习英语专四作文的时候才能熟练&#xff0c;下面是为大家分享的&#xff1a;“2021年英语专四作文范文&#xff1a;计算机将取…

python 接入钉钉群告警

背景 1 环境 python3.7 2 邮件控制服务&#xff08;由于公司用了zabbix&#xff08;服务器基础设施&#xff09;&#xff0c;elk&#xff08;业务报警&#xff09;&#xff0c;promethues alertManager&#xff08;主要是k8s上面使用&#xff09;,grafana&#xff08;部分pro…

钉钉自定义机器人接入

用钉钉机器人&#xff0c;可以做一些通知&#xff0c;比如说程序的预警&#xff0c;风控啊。 官方描述 看官网描述&#xff0c;很强大&#xff0c;支持文本&#xff0c;链接&#xff0c;Markdown。 添加完机器人可以用curl工具随便发点什么试试&#xff1a; curl ‘https://oap…

钉钉企业内部应用 - 获取考勤打卡结果

本文是根据钉钉官方文档归纳所出&#xff0c;最后有 PHP 测试成功的 demo。 概述 钉钉登录是基于 OAuth2.0 协议标准构建的钉钉 OAuth2.0 授权登录系统。 在进行钉钉 OAuth2.0 授权登录接入之前&#xff0c;需要先创建一个应用&#xff0c;并获得相应的 AgentId 和 AppSecret。…

通过Webhook接入钉钉群自定义机器人

在钉钉群中添加Webhook自定义机器人&#xff0c; 复制Webhook地址保存&#xff1a; https://oapi.dingtalk.com/robot/send?access_tokenxxxxxx 安全设置&#xff1a;选择加签方式&#xff0c;复制加签保存 #!/usr/bin/python # -*- coding: utf-8 -*- import requests imp…

注册之谷歌验证码

验证码的使用 前言一、验证码jar包二、谷歌验证码Kaptcha的使用1.在web.xml文件中配置用于生成验证码的Serclet程序2.在表单中使用img标签显示并使用3.获取服务器验证码和客户端进行比较4.切换验证码 总结 前言 在许多项目中都会涉及到登陆注册&#xff0c;而我们日常的注册除…

网站注册登录等短信验证码

现在随着时代的发展&#xff0c;许多网站的注册&#xff0c;或者登录都和手机号码关联在一起&#xff0c;这样也方便了我们记住账号&#xff0c;下面我就来说一下怎么用php发短信&#xff0c;这个是卸载&#xff08;lavarel&#xff09;框架的。 这里给大家介绍一个平台--云信…

输入手机号获取验证码的注册页面,说出测试过程

考察的点有两个&#xff0c;一个是对手机号格式和验证码格式的验证&#xff0c;一个是对验证码获取功能的验证。 基本原理&#xff1a;验证码1分钟内只能发一次&#xff0c;有效期10分钟。验证码是后台Java代码生成的&#xff0c;然后验证码生成时间和此验证码会保存在数据库的…

证券交易1-交易系统简介

证券交易过程&#xff0c;主要的过程是个人投资者或者机构投资者&#xff0c;按照股票的行情&#xff0c;报价下订单到交易所的&#xff0c;然后收到交易所回报的过程。本文主要介绍了这一交易过程中涉及到的系统。 证券交易业务流程图&#xff1a; 证券交易IT系统架构图&…

通达信交易系统接口是不是免费的?

通达信是一款第三方的交易系统&#xff0c;它可以跟我们常用的券商系统进行对接&#xff0c;所以通达信更像是一款接口型软件&#xff0c;但是为什么大家要做交易时&#xff0c;不直接使用券商交易系统&#xff0c;反而选择用通达信交易系统接口呢&#xff1f;这样难道不是还多…

“Safari 16.4 发布,简直是开发者的‘地狱’!”

以往 Safari 发布新版本&#xff0c;因其更新时间及更新内容的不确定性&#xff0c;时而都会给开发者带来一些问题&#xff0c;但都比不上这次 Safari 16.4 发布带来的麻烦大。 原文链接&#xff1a;https://www.construct.net/en/blogs/ashleys-blog-2/safari-releases-develo…