【NLP 49、提示工程 prompt engineering】

目录

一、基本介绍

语言模型生成文本的基本特点

提示工程 prompt engineering

提示工程的优势

使用注意事项

① 安全问题        

② 可信度问题

③ 时效性与专业性        

二、应用场景

能  ≠  适合

应用场景 —— 百科知识

应用场景 —— 写文案

应用场景 —— 解释 / 编写一段代码

应用场景 —— 简历生成

应用场景 —— Excel应用

应用场景 —— 模拟面试

应用场景 —— 文章相关性打分

三、使用技巧

1.模型相关参数的设置

2.中英文prompt

3.不明确的prompt会引发猜测

​编辑

4.prompt结构示例

示例: 

​编辑

其他模板示例:

① Role-Task-Format (角色-任务-格式)

② Task-Action-Goal (任务-动作-目标)

③ Before-After-Bridge (之前-之后-桥梁)

④ Context-Action-Result-Example (环境-行动-结果-例子)

技巧


一个人很少能赢,但总有赢的时候

                                                ——25.3.26

一、基本介绍

        语言模型  Language Model:根据上文,计算下一个字的概率分布

        大模型也是同样的原理:不断依照概率选取下一个字,迭代生成文本


语言模型生成文本的基本特点

1.黑盒

2.相似的表达,不一定有相似的回复(随机采样策略)

3.完全相同的输入,也可以有不同的结果(随机采样策略)

输入的文本,也被称为提示词 prompt


提示工程 prompt engineering

        提示工程(Prompt Engineering)是一门较新的学科,关注提示词开发和优化,帮助用户将大语言模型(Large Language Model, LLM)用于各场景和研究领域。 掌握了提示工程相关技能将有助于用户更好地了解大型语言模型的能力和局限性。

        研究人员可利用提示工程来提升大语言模型处理复杂任务场景的能力,如问答和算术推理能力。开发人员可通过提示工程设计、研发强大的工程技术,实现和大语言模型或其他生态工具的高效接轨。

        提示工程不仅仅是关于设计和研发提示词。它包含了与大语言模型交互和研发的各种技能和技术。提示工程在实现和大语言模型交互、对接,以及理解大语言模型能力方面都起着重要作用。用户可以通过提示工程来提高大语言模型的安全性,也可以赋能大语言模型,比如借助专业领域知识和外部工具来增强大语言模型能力。


提示工程的优势

        如果任务定义的好的话,可以直接使用模型进行预测,而不需要传统机器学习那样训练

        模型不做针对性训练,仅设计针对性的prompt

        没有标注成本,快速投入使用

        应用范围广泛


使用注意事项

① 安全问题        

目前网上的许多类chatgpt项目是以接口方式提供服务,输入问题都会被发送到对方服务器,需要注意数据安全

② 可信度问题

语言模型的生成结果本身具备一定随机性

语言模型可以生成完全错误,但看起来通顺的文本

③ 时效性与专业性        

脱离网络的语言模型受制于训练数据的时效性,在细分专业领域的回答受数据质量和数量限制 


二、应用场景

        可以认为与文本(文字、代码、字符)生成有关的,人类已有公开在线资料讲述过的任务,ChatGPT都能做

能  ≠  适合

适合使用提示工程来完成的场景: ① 自己完全能够完成,但是很花时间 ② 自己没有完整思路,但完全能够判断结果的正确性 ③ 纯创意型场景(没有正确性要求)

不建议的场景: ① 获取自己不熟悉的领域的信息,或实时性信息 ② 数字计算型任务 ③ 处理分析很大量的数据


应用场景 —— 百科知识

应用场景 —— 写文案

应用场景 —— 解释 / 编写一段代码

应用场景 —— 简历生成

应用场景 —— Excel应用

应用场景 —— 模拟面试

应用场景 —— 文章相关性打分


三、使用技巧

1.模型相关参数的设置


2.中英文prompt

        由于ChatGPT是英文训练语料为主,一般来说使用英文会强于中文,但是区别没有想象的那么大,如无特殊需求,中文一般可以满足需求,不必强行配合翻译软件使用

        国内的大模型一般使用中文提示词问答效果较好


3.不明确的prompt会引发猜测


4.prompt结构示例

一个prompt中指令词和输入至少会存在一项,背景和输出要求则可能均不存在

示例: 

其他模板示例:

① Role-Task-Format (角色-任务-格式)

- 角色:指定大模型的角色,比如“你是一个市场营销专家”。

- 任务:明确任务,例如“你需要制定一个推广策略,为运动品牌推广新的健身服装”。

- 格式:指定输出格式,如“你的输出应包括品牌核心信息、视觉元素设计、以及定位目标用户的策略等”。

② Task-Action-Goal (任务-动作-目标)

- 任务:确定模型的任务,如“评估团队成员的表现”。

- 动作:描述执行的动作,例如“分析每个团队成员的优势和劣势”。

- 目标:设定明确的目标,如“提升团队的整体表现,使客户满意度提高”

③ Before-After-Bridge (之前-之后-桥梁)

- 之前:描述当前状态,如“我们目前在搜索引擎结果页的排名是第50位”。

- 之后:明确期望结果,如“我们希望在三个月内进入前10名”。

- 桥梁:描述实现目标所需的步骤,如“制定和执行一个全面的搜索引擎优化策略”。

④ Context-Action-Result-Example (环境-行动-结果-例子)

- 环境:提供问题或活动的背景信息,例如“为了提升品牌形象,推广我们的环保材料制成的新鞋”。

- 行动:描述要执行的具体行动,如“通过社交媒体进行一系列营销策划,重点突出鞋子的环保材料”。

- 结果:预期结果,如“提高消费者对品牌的认识,并增加销量”。 - 例子: 提供类似的成功案例,如“从知名鞋类品牌与环保公司合作的例子寻找灵感。”

技巧

① 设定自己的角色

② 设定ChatGPT的角色

③ 详细、明确的描述

④ 提供背景信息

⑤ 思维顺序引导

⑥ 在提示词中合理使用分隔符

⑦ 给模型一些拒识出口

⑧ 要求模型结构化输出

⑨ 拆解任务步骤

⑩ 利用一些法则

⑪ 让AI自己提问

⑫ 提供示例 Few shot

⑬ 加入思维链 Few shot with Chain-of-Thought

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/41369.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【NLP 43、文本生成任务】

目录 一、生成式任务 二、seq2seq任务 1.模型结构 2.工作原理 3.局限性 三、自回归语言模型训练 Decoder only 四、自回归模型结构:文本生成任务 —— Embedding LSTM 代码示例 🚀 数据文件 代码流程 Ⅰ、模型初始化 Ⅱ、前向计算 代码运行流程 Ⅲ、加载…

vscode 通过Remote-ssh远程连接服务器报错 could not establish connection to ubuntu

vscode 通过Remote-ssh插件远程连接服务器报错 could not establish connection to ubuntu,并且出现下面的错误打印: [21:00:57.307] Log Level: 2 [21:00:57.350] SSH Resolver called for "ssh-remoteubuntu", attempt 1 [21:00:57.359] r…

Linux之编辑器vim命令

vi/vim命令: 终端下编辑文件的首选工具,号称编辑器之神 基本上分为三种模式,分别是 命令模式(command mode)>输入vi的命令和快捷键,默认打开文件的时候的模式插入模式(insert mode&#x…

第一天学爬虫

阅读提示:我今天才开始尝试爬虫,写的不好请见谅。 一、准备工具 requests库:发送HTTP请求并获取网页内容。BeautifulSoup库:解析HTML页面并提取数据。pandas库:保存抓取到的数据到CSV文件中。 二、爬取步骤 发送请求…

MySQL实战(尚硅谷)

要求 代码 # 准备数据 CREATE DATABASE IF NOT EXISTS company;USE company;CREATE TABLE IF NOT EXISTS employees(employee_id INT PRIMARY KEY,first_name VARCHAR(50),last_name VARCHAR(50),department_id INT );DESC employees;CREATE TABLE IF NOT EXISTS departments…

windows下安装sublime

sublime4 alpha 4098 版本 下载 可以根据待破解的版本选择下载 https://www.sublimetext.com/dev crack alpha4098 的licence 在----- BEGIN LICENSE ----- TwitterInc 200 User License EA7E-890007 1D77F72E 390CDD93 4DCBA022 FAF60790 61AA12C0 A37081C5 D0316412 4584D…

激光线检测算法的FPGA实现

激光线检测算法的FPGA实现 1. 常见的激光线检测算法 激光线检测中常用的三种算法 MAX(最大值法)、THRESH(阈值法)、COG(灰度重心法) 分别具有以下特点和工作原理: 1.1 MAX(最大值法…

小样本微调大模型

一、环境搭建 conda create -n dseek python=3.10 conda activate dseek pip install bitsandbytes Pip install numpy python -m pip install --upgrade pip setuptools wheel 安装cuda,torch,Unsloth, huggingface,wandb等,见前述章节; 微调服务器配置:单机笔记本显卡4…

深入理解指针(2)(C语言版)

文章目录 前言一、数组名的理解二、使用指针访问数组三、一维数组传参的本质四、冒泡排序五、二级指针六、指针数组七、指针数组模拟二维数组总结 前言 在上一篇文章中,我们初步了解了指针的基本概念和用法。今天,我们将继续深入探索指针在数组、函数传…

高效内存管理:x86-64架构中的分页机制

在 x86-64 架构的世界里,内存分页机制扮演着举足轻重的角色,它就像是一座桥梁,连接着虚拟地址与物理地址。简单来说,内存分页机制就是将线性地址(也就是虚拟地址)切分成一个个固定大小的页,并把…

统一开放世界与开放词汇检测:YOLO-UniOW无需增量学习的高效通用开放世界目标检测框架

目录 一、摘要 二、引言 三、相关工作 开放词汇对象检测 开放世界目标检测 参数高效学习 四、高效通用的开放世界目标检测 问题定义 高效的自适应决策学习 开放世界通配符学习 五、Coovally AI模型训练与应用平台 六、实验 数据集 评价指标 实施细节 定量结果 …

fileinclude

##解题思路 场景首页没有什么提示,只有个flag在flag.php中,而且需要更改language,还有个index.php的路径,先记住它 习惯性查看源代码,得到了题目真正的内容,关键在于lan变量读取我们传入的Cookie值中的lang…

链表-LeetCode

这里写目录标题 1 排序链表1.1 插入法 O(n)1.2 归并排序 1 排序链表 1.1 插入法 O(n) /*** Definition for singly-linked list.* struct ListNode {* int val;* ListNode *next;* ListNode() : val(0), next(nullpt…

计算机网络基础:WiFi 与蓝牙的原理与应用

计算机网络基础:WiFi 与蓝牙的原理与应用 一、前言二、WiFi 原理2.1 概述2.2 工作频段2.2.1 2.4GHz 频段2.2.2 5GHz 频段2.3 调制技术2.3.1 正交频分复用(OFDM)2.3.2 直接序列扩频(DSSS)2.4 通信协议2.5 网络架构2.5.1 独立基本服务集(IBSS)2.5.2 基础服务集(BSS)2.5.…

深入解析 Java 类加载机制及双亲委派模型

🔍 Java的类加载机制是确保应用程序正确运行的基础,特别是双亲委派模型,它通过父类加载器逐层加载类,避免冲突和重复加载。但在某些特殊场景下,破坏双亲委派模型会带来意想不到的效果。本文将深入解析Java类加载机制、…

【数据可视化艺术·进阶篇】热力图探秘:用色彩演绎场馆和景区的人流奥秘

假期出游,你是不是也遇到过这样的状况:想去的热门景点,放眼望去全是攒动的人头,根本没法好好欣赏风景;而景区里一些小众角落,却冷冷清清,鲜有人至。还有在轨道交通枢纽、大型体育场这些地方&…

理解文字识别:一文读懂OCR商业化产品的算法逻辑

文字识别是一项“历久弥新”的技术。早在上世纪初,工程师们就开始尝试使用当时有限的硬件设备扫描并识别微缩胶片、纸张上的字符。随着时代和技术的发展,人们在日常生活中使用的电子设备不断更新换代,文字识别的需求成为一项必备的技术基础&a…

智能监控视频聚合平台,GB28181/RTSP/SIP/RTMP直播会议融合方案

全场景智能监控聚合平台:打破边界,赋能高效协同 在数字化转型加速的今天,海量视频监控设备、多样化的编码协议与复杂的业务场景,让企业面临跨系统整合难、资源调度效率低、协作响应慢等痛点。我们的智能监控聚合平台以技术创新为…

【机器学习】imagenet2012 数据预处理数据预处理

【机器学习】数据预处理 1. 下载/解压数据2. 数据预处理3. 加载以及训练代码3.1 使用PIL等加载代码3.2 使用OpenCV的方式来一张张加载代码3.3 h5的方式来加载大文件 最后总结 这个数据大约 140个G,128w的训练集 1. 下载/解压数据 首先需要下载数据: 数据最后处理…

语言模型理论基础-持续更新-思路清晰

1.预训练 相似的任务A、B,任务A已经用大数据完成了训练,得到模型A。 我们利用-特征提取模型的-“浅层参数通用”的特性,使用模型A的浅层参数,其他参数再通过任务B去训练(微调)。 2.统计语言模型 通过条件…