从原理总结chatGPT的Prompt的方法

一 什么是chatGPT

chatGPT全称是Generative Pre-trained Transformer,它是一种专注于对话生成的语言模型,可以根据用户的文本输入,做出相应的智能回答。chatGPT是由OpenAI于2018年研发的语言模型,其中OpenAI是于2015年由特斯拉的马斯克、Sam Altman及其他投资者创立,目标是开发出造福人类的AI技术。
chatGPT主要有如下特征:

  • 敢于质疑:对不正确的问题会反驳
  • 承认无知:承认自己知识的局限和不足,吸收对话人员的知识
  • 支持多轮对话
  • 主动承认错误:如果对话人对其答案不满足,它会承认自己的错误

二 ChatGPT的工作原理

这里不会做过多的算法公式深入,只是从浅显的表面介绍chatGPT,其作用是为如果做Prompt来做前提深入

2.1 核心原理

chatGPT的核心原理,用chatGPT自己的回答来说主要有三个部分:
Transformer模型:是一种基于自注意力机制的神经网络模型,被广泛应用于自然语言处理领域中的文本生成任务。简单来说,可以做长文本的处理,并支持下一轮对话
自监督预训练 :是指从无监督的原始数据中提取出有用的信息,从而训练神经网络。简单来说,就是它可以自己监督自己,获取信息训练自己。
Fine-Tuning微调 :在已经预训练好的模型的基础上,通过少量的数据对模型进行重新调整以适应新的下游任务。简单来说,就是不断的做自我的调整,优化模型和参数,使得对话回答更加高质量。

2.2 其他相关原理

除了chatGPT的核心原理,其实我们也需要关注相关的辅助基础模型原理,这些原理都是chatGPT可以正常交流的基础,因为ChatGPT是一种集成了语言运用、语义理解和世界知识的复杂模型。下面主要总结如下。

2.2.1 NLP模型

NLP全称是Natural Language Processing,翻译成中文是自然语言处理,简单来说,模型的设计主要是让计算机可以读懂人类语言,将文字转化为可以被计算识别的数字,向量或矩阵,再根据处理的数据结果,按照实际需求任务进一步处理。
NLP主要有两大任务:一类是文本序列输出,即根据给定的文本序列输出新的文本序列,这类常见的包括语言类的翻译,还有文本风格的转换;另一类是文本识别分类,这一类比较常见的包括情感分类以及关键实体的名词识别等。
NLP两大任务

2.2.2 GPT模型

GPT全称是Generative Pre-trained Transformer,中文是生成型预训练变换模型,其主要的作用是,通过录入的文本,来判断文本实际是人话的概率,并且可以根据文本来预测下一个位置出现文本字典对应各个文字的概率,概率大的即为实际要回复的文本。这里也就是2.1部分所说的核心原理,整个模型和模型结构是非常复杂的,这里不做过多的模型结果表述
在这里插入图片描述

2.2.3 RLHF模型

RLHF全称是Reinforcement Learning From Human Feedback,中文是人类反馈强化学习,该模型实际是强化学习的一种,其主要的原理是,通过机器与所处的环境进行交互,交互的结果会使用奖励或者惩罚的方式反馈给机器,机器会根据实际的反馈结果做自我的学习和自我的决策调整。该模型主要应用于游戏领域,一般是游戏机器和人进行博弈时,针对实际的有效状态做出不同的游戏机制,当游戏机制关卡开启后会开启下一个游戏的状态,依次进行。
RLHF这里的训练主要是有三个步骤:
第一步:预训练语言模型(SFT,Supervised fine-tuning),即提供基础的训练模型,做基础的参数初始化
第二步:收集数据并训练奖励模型(RM,Reward Model),即给出收集的数据,并根据训练结果给出奖励和惩罚的模型
第三步:通过强化学习微调语言模型 LM(LM,Language Model)
下图是RLHF源说明的经典图例:
RLHF原理

2.2.4 TAMER框架

TAMER的全称是Training an Agent Manually via Evaluative Reinforcement,对应中文是评估式强化人工训练代理,其主要的使用原因,从笔者的理解,是因为目前强化学习存在一些弊端。首先是强化学习需要做不同领域的数据收集和探索,其成本比较高;其次强化学习的收敛速度比较慢,不一定在短期内达到训练的效果;最后是因为强化学习整体的训练成本比较高。
为了加快训练速度,TAMER框架被引入,即通过人类标记者向Agents机器提供奖励反馈(即指导Agents进行训练),从而快速达到训练任务目标,不同人的参与和标识的知识,以奖励的形式训练Agent,可以帮助其快速收敛。
下图是TAMER比较经典的一张原理流程图:

TAMER流程

2.2.5 迁移学习

迁移学习英文是Transfer Learning,学术的解释是把为任务 A 开发的模型作为初始点,重新使用在为任务 B 开发模型的过程中。简单来说,迁移学习更像是举一反三的写照,比如研究麻雀,可以帮助研究其他鸟类;学习电子琴可以帮助高效学习钢琴。
迁移学习和监督学习、无监督学习有一定的联系。监督学习往往是在已有的大量的样本数据上进行的已有的学习训练模型,主要应用的场景包含回归和分类场景;无监督学习,往往是在样本不足甚至没有的场景下进行的学习训练模型,一般是做聚类场景比较多,比如K-Means聚类。
但是目前的监督和无监督学习存在的主要问题有如下:首先存在数据量大,但是不一定有完整标注的的数据,无法支持模型训练;其次虽然有数据,但是现有计算资源和数据量都是有限的无法做完整的训练;再者存在不同的个性化需求,同一个任务往往一个训练模型无法做到多种场景的个性化支持;另外也存在部分迁移或者冷启动的场景,数据和程序无法做完整支持。
迁移学习针对迁移的方法不同,可以分为如下几种:

  • 基于样本的迁移(Instance based Transfer Learning):即做数据样本的迁移,由于增加样本权重因素等场景需要可以做到样本的重复使用;
  • 基于模型迁移((Parameter/Model based Transfer Learning):即对模型的迁移,使得源域和目标域对象的参数可以共享,并做模型的重复使用;
  • 基于特征的迁移(Feature based Transfer Learning):即基于特征变换,将源域的和目标域做迁移,减少源域和目标域之间的差距;
  • 基于关系的迁移(Relation Based Transfer Learning):即基于源域以及其相关的逻辑关系进行迁移

2.3 chatGPT的发展

chatGPT自2018年开始研发到现在,其实发展了多个版本,由于训练数据的范围,在3.5版本之前它还没有联网搜索能力。因此ChatGPT3.5版本及之前版本只能基于2021年提供的数据做回答,比如它不知道2022年世界杯的冠军,也不知道2023年的春晚节目单。
自发布到现在,已经迭代多个版本,每一个版本迭代后,其参数量都是呈现爆炸式增长,可以参考如下:
参数量变化
参考折线图如下:
参数变化

三 如何做promot

3.1 基于原理的思考

如今最初使用chatGPT的人是否和笔者有同样的经历,在咨询chatGPT的时候,会有获得不到想要的答案的困惑。其实在总结上述的基础原理上可以很轻易了解,自己的困惑对应的问题出现在哪里,是否是自己根据实际机器的原理来做问题的回答。
综合上述原理,我们可以理解和机器沟通的技巧,应该要考虑:

  • 是否可以正常说出语言
  • 是否可以给出机器能听懂的语言
  • 是否可以提供给机器正确的反馈和要求
  • 是否了解自己想要什么

总结参考原理,沟通的要求可以参考如下图:
参考原理

3.2 经典范式

除了根据原理的思考外,我们更重要的是要总结,是否有统一的范式,可以帮助我们做更标准的沟通咨询,从而获得chatGPT的高质量回复。这里适用比较多的一种范式,是参考情景学习的方式
情景学习,即把咨询的问题要交代清楚是来自哪一个领域,最好是举一个例子,把chatGPT当做6、7岁的孩子做说教,有利于模型快速定位检索出实际需要的相关知识。其次最好有一个统一的格式来呈现说明的例子和问题及要求,这样可以方便chatGPT按照格式,根据规定依次按照顺序回答问题。

标准的范例参考如下格式:好的Prompt提示=立角色+说问题+给目标+补要求

  • 立角色:即给出实际的chatGPT角色,方便chatGPT快速定位业务领域
  • 说问题:说明自己要咨询的问题是什么
  • 给目标:即需要chatGPT输出一份怎样的结果给自己,即其任务是什么
  • 补要求:即对输出结果的要求补充,以及问题的前提条件

可以参考下图举例:

经典范式

3.3 来自chatGPT给的建议

如下是咨询chatGPT,chatGPT回复的几种prompt的方式参考
chatGPT回复

3.4 其他提示方式

也有推荐的几种提示词可以做参考:
方式1 :let’s think step by step(请按照步骤来思考)
当你需要了解分析思路和步骤时,可以使用这个指令
举例参考如下:
回复结果1

方式2:“Please provide a detailed explanation”(请提供详细说明)
当涉及到专业术语和名词的解释时,可以在问题后附加这一句话
范例2

方式3:“Please list the pros and cons”(请列出优缺点)
当你针对某个主题需要做选择或者建议时,需求chatGPT给出详细的建议,可以附加这个指令
参考样例如下:
范例3

方式4:“Can you provide a step-by-step guide?”(你能提供一步一步的指导吗?)
当你需要完成某个任务或学习某个技能时,这个指令可以让ChatGPT提供一个分步指南
参考样例如下:
范例4

方式5:“Can you break it down into simpler terms?”(你能把它分解成更简单的术语吗?)
咨询时,需要做必要说明时可以附加这个指令
参考样例如下:
范例5

3.5 针对范式的其他总结

目前不同行业领域也有不同的范式总结
使用chatGPT做回答,已经逐渐成为自己的一种生活助手和工作提效工具,更好的咨询可以帮助为工作和生活更好的赋能
其他资料包,可以自行参考总结,目前笔者收集可提供的资源链接参考:ChatGPT的Prompt相关资料汇总,如有需要,可以自行免费下载

四 关于ChatGPT的总结

4.1 可以考虑的应用场景

首先chatGPT应用的场景很多,不仅仅做简单的问答,笔者梳理可参考的场景如下:
应用场景

4.2 ChatGPT如何发挥更大效果的思考

chatGPT的应用可以结合不同的AI自动化工具或者其他应用工具实现,能够发挥其意想不到的效果。
比如chatGPT可以输出文案,比如小红书格式的文本;也可以使用相关自动PPT工具,自动生成PPT,参考PPT自动生成工具:mindshow;利用chatGPT也可以输出画图的相关脚本,做出简单的流程图;chatGPT做知识框架梳理也是非常无敌,可以根据实际输出的结果,转化成md格式,直接打开脑图。
参考如下是chatGPT输出的Excel基础知识框架
chatGPT的输出结果展示

4.3 chatGPT相关缺点

ChaTGPT也有一些缺点需要参考借鉴:
1.可能会胡说八道: 如果相关领域的资料缺乏,或者相关语言资料缺乏,chatGPT仍然会给出一个回答,但是这种答案可能是错误的,容易误导人,所以结果需要自己再做一轮检验
2.无法处理复杂语言结构: ChatGPT无法处理复杂冗长或者特别专业的语言结构,对于金融、自然科学或医学等非常专业领域的问题,如果没有进行足够训练,ChatGPT可能无法生成适当的回答
3.需要考虑性能问题:chatGPT的机器涉及到数十亿的参数模型,需要惊人的计算资源和大算力服务器支持,需要考虑实际的运行成本
4.需要谨慎非法场景:提问时,需要小心考虑相关提问的私人信息会被收集;另外也会存在被某些人滥用来制造虚假信息和虚假内容等,防止上当受骗
5.需要考虑其主观的色彩 :如果训练内容不足,回复的结果容易生成带有偏见、歧视和不符合伦理的内容(训练使用的数据集里就存在),因此不能保证ChatGPT不会产生攻击甚至伤害用户的表述
6.回复依赖问题的提问方式:某些任务的返回结果受提示词的影响较大,如果问的方式不对,回复可能不是想要的结果,因此提问人需要考虑如何优化自己的提问方式

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/4012.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

ChatGPT 可以在 2023 年提高您的工作效率的 10 种不可思议的方式

大多数人不知道如何充分发挥 ChapGPT 的潜力,以最有效的方式提高您的工作效率。本文向您展示了您必须知道的 10 个令人难以置信的 ChapGPT 实用案例! ChatGPT 是一种人工智能 (AI) 技术,旨在与人进行对话。它可以以类似于人类的方式理解和回…

一旦80%的开发人员都开始利用ChatGPT提升工作效率后,挑战与机遇在哪里?

其实我现在已经开始逐渐开始喜欢上ChatGPT了,上班时间摸摸鱼,和ChatGPT畅谈一下理想,遇见一些不太熟练的代码也懒得去上网查了,直接问一问ChatGPT,然后自己再放置到自己的代码里,改一改,很完美。…

InstructGPT 与 ChatGPT的学习与解读

最近ChatGPT大火,简单整理了一些文章和帖子。 ps.此时ChatGPT还没公布相应的论文,所有以下内容为官网发布内容,以及一些合理的推测。 InstructGPT 相比于GPT,2022年初推出的InstructGPT在某种程度上更像是ChatGPT的“直系前辈”…

ChatGPT 到底强大在哪里?(文末有彩蛋)

ChatGPT 是由 OpenAI 开发的一个人工智能聊天机器人程序,于2022年11月推出。该程序使用基于 GPT-3.5 架构的大型语言模型并通过强化学习进行训练。ChatGPT 以文字方式交互,而除了可以通过人类自然对话方式进行交互,还可以用于相对复杂的语言工…

chatGPT使用教程-提问的六个层次

为了让广大用户能够快速掌握聊天AI工具的使用方法,我们经过一段时间的摸索,并向各路高手请教学习,总结出了一些向类似于ChatGPT这样的聊天AI提问的技巧。我们将聊天AI的提问分为六个层次,从简单到复杂逐步讲解,帮助您解…

ChatGPT 已成为下一代的新操作系统!

作者 | 屠敏 出品 | CSDN(ID:CSDNnews) 「操作系统 20 年一周期」这一经典理论,正在科技发展的长河中得到了新一轮的验证。 如果说 Windows 引领了 PC 互联网新时代,iOS、Android 成为了移动开发时代的敲门砖&#xff…

《ChatGPT百科全书》你对ChatGPT的问题都可以在这里找到答案

我花了一周时间整理了份《ChatGPT百科全书》,里面涵盖了账号、ChatGPT小白科普、Prompt学习由浅入深、ChatGPT花式玩法、AI工具库、利用ChatGPT变现的90种方法以及最新研报等; 传送门:Docshttps://xum666e6ro.feishu.cn/docx/Sk11dgxhtoQFKd…

如何与ChatGPT交流,获得你想要的答案?正确提问是关键

正确提问是与ChatGPT交流时达到预期结果的必要技能。ChatGPT是一种人工智能聊天机器人,它可以回答你的问题、提供帮助、分享知识等。然而,与ChatGPT交流时,你需要注意一些技巧,以确保你能够得到你想要的答案。首先,要明…

用了 ChatGPT 后,我迫不及待的问了它这 10 个问题

前言 20230208 日,ChatGPT 已经联手微软登录必应搜索引擎,谷歌、百度等巨头更是紧随其后着急麻慌的推出自己的 AI 聊天产品,有理由相信,传统搜索引擎时代已经结束,不远的未来,每个人家里都会有一个可以陪你…

ChatGPT百科全书,你的问题都可以在这里找到答案

我花了一周时间整理了一份ChatGPT百科全书; 涵盖了账号篇/prompt指令学习、模板/花式玩法/AI工具库/高分插件/90种chatgpt挣钱方法/研报等;基本对chatgpt的所有问题都可以在这里面找到答案; 传送门:Docshttps://xum666e6ro.feis…

ChatGPT研究框架(2023)

开发者(KaiFaX) 面向全栈工程师的开发者 专注于前端、Java/Python/Go/PHP的技术社区 ChatGPT市场反应热烈,国内外巨头纷纷入场 据统计,ChatGPT日活跃用户数的增速远超Instagram,1月份平均每天有超过1300万名独立访问者…

【关于ChatGPT的30个问题】30、ChatGPT未来的发展趋势是什么?/ By 禅与计算机程序设计艺术

30、ChatGPT未来的发展趋势是什么? 目录 30、ChatGPT未来的发展趋势是什么? ChatGPT未来发展趋势

ChatGPT研究(一)——AI平民化的里程碑

✏️写作:个人博客,InfoQ,掘金,知乎,CSDN 📧公众号:进击的Matrix 🚫特别声明:创作不易,未经授权不得转载或抄袭,如需转载可联系小编授权。 前言 …

Claude Prompt工程 -- chatgpt最强对手

github地址:GitHub - Jerenyaoyelu/claude-prompt-engineering: Claude AI Prompt engineering. Learn to use Claude well. 一些使用claude的提示工程心得 文章目录 一、Claude 自我介绍 二、对比 Chatgpt 优势 三、如何使用 四、文档QA能力 五、视频 QA 能力 六、…

【AI实战】训练一个自己的ChatGPT

【AI实战】训练一个自己的ChatGPT 准备环境代码模型 数据集Belle下载 Belle 的开源中文数据集(仅限研究使用,禁止商用!)清洗自己的数据集上述工作完成后,大概是这样子的 训练测试参考 本文使用 Alpaca-LoRA 来训练一个…

ChatGPT探索系列之三:探究ChatGPT的训练、优化和应用方法

文章目录 前言一、ChatGPT训练原理二、采样和微调阶段三、采样和训练奖励模型阶段三、采样和训练奖励模型阶段总结 前言 ChatGPT发展到目前,其实网上已经有大量资料了,博主做个收口,会出一个ChatGPT探索系列的文章,帮助大家深入了…

想让 ChatGPT 帮忙进行数据分析?你还需要做......

近年,火出圈的 ChatGPT 掀起了久违的人工智能的热潮,如何更好地让人工智能真正为企业所用,也成了近期的热门话题。大数据和人工智能两者相辅相成,人工智能的训练以大量数据作为基础,而数据的价值则需要人工智能的充分挖…

高频交易与量化交易到底有什么区别?

高频交易也可以说是量化交易,但是量化交易可不仅仅是高频交易。或者说,高频交易是量化交易中的一个部分,一种形式。都是资本市场和计算机领域快速发展的必然产物。 近些年来国内的大数据产业链和芯片的迅猛发展,投资所需的大型数…

外汇量化交易之高频交易策略

很多投资者对外汇高频交易策略一知半解今日小恩与大家聊聊高频交易策略。 外汇高频交易策略是什么? 字面意思也可以理解,高频率做单的外汇交易方式。高频交易是自动化交易的一种形式,它利用复杂的计算机技术和软件系统以极快的速度快速执行…