chatgpt概述性分享:大家是如何用chatgpt的?

简述

训练方式

在一个比较强的BaseModel(GPT3.5)上继续用数据微调(SFT),但这次的微调还引入了一种学习方式叫RLHF(Reinforcement Learning from Human Feedback,人类反馈强化学习)。

所以可以简单总结为:强BaseModel微调 + RLHF

训练过程

第一阶段:训练监督模型

GPT 3.5本身很难理解人类不同类型指令中蕴含的不同意图,为了让GPT 3.5初步具备理解指令的意图,首先会在数据集中随机抽取问题,由人类标注人员,给出高质量答案,然后用这些人工标注好的数据来微调 GPT-3.5模型(获得SFT模型, Supervised Fine-Tuning)。

此时的SFT模型在遵循指令/对话方面已经优于 GPT-3,但不一定符合人类偏好。

第二阶段:训练奖励模型(Reward Model)

在数据集中随机抽取问题,使用第一阶段生成的模型,对于每个问题,生成多个不同的回答。人类标注者对这些结果综合考虑给出排名顺序。接下来,使用这个排序结果数据来训练奖励模型。对多个排序结果,两两组合,形成多个训练数据对。

RM模型接受一个输入,给出评价回答质量的分数。这样,对于一对训练数据,调节参数使得高质量回答的打分比低质量的打分要高。

第三阶段:采用PPO(Proximal Policy Optimization,近端策略优化)强化学习来优化策略。

这一阶段利用第二阶段训练好的奖励模型,靠奖励打分来更新预训练模型参数。在数据集中随机抽取问题,使用PPO模型生成回答,并用上一阶段训练好的RM模型给出质量分数。

把回报分数依次传递,由此产生策略梯度,通过强化学习的方式以更新PPO模型参数。

如果我们不断重复第二和第三阶段,通过迭代,会训练出更高质量的ChatGPT模型。


 

应用和效果

以下内容按照是否“只需要嵌套一个prompt就能达到目标”来分类。

一步到位

只需要根据任务套prompt,就可以达到目标,但前提是需要精心设计尝试多种prompt。

翻译

prompt示例

请你帮我把#START和#END之间的文本翻译成英文#START
{content}
#END

相关产品

    1. OpenAI translator 划词翻译和文本润色的浏览器插件
    2. 沉浸式翻译 智能识别网页主内容区,双语显示,中文/英文对照着看
    3. ByteLingo英语助手 公司内专用,不用输key

摘要

prompt示例

相关产品

    1. Glarity 一款开源浏览器插件,主要功能是利用 ChatGPT为谷歌搜索、YouTube视频等网站内容生成摘要。

    1. Wiseone

辅助创作/笔记工具

prompt示例

相关产品

    1. Notion AI

其他

  1. 代码补全、生成、debug

prompt示例:

结果:

  1. 正则表达式生成

prompt示例:

结果:

多步到位

文档向量索引

应用场景

input有两类:一个是{doc},一个是{query}

output必须为:基于doc的{answer}

  1. 可以对论文、小说、网页文章、简历、合同等任何长文本内容,进行快速整理摘要重点,或者是针对某个问题提取doc中的答案(不会自己随意生成),如果想要深入研究某个答案,还可以直接索引到那块内容来细看。

相关产品

    1. ChatPdf
    2. ChatDoc

效果

原理

使用openai api来实现对话式文档问答,最朴素的想法把这个当成一个阅读理解问题,构建如下的prompt:

现有一个问题:“洗碗机排水管堵塞了怎么办”,请根据下面的文章来回答,文章内容如下:"......"


 

这种方法在文档较长时存在两个问题:

  • 第一,openai api存在最大长度的限制,例如chatgpt的最大token数为4096,此时直接对文档截断,存在上下文丢失的问题
  • 第二,api的调用费用和token长度成正比,tokens数太大,则每次调用的成本都会很高

参考搜索引擎中“先检索再重排”的思路,针对文档问答设计“先检索再整合“的方案。

整体思路如下:

  • 首先准备好文档,把每个文档切成若干个小的chunks
  • 将每个chunk转为一个向量,存入向量数据库
    • 文本转向量可以使用openai embedding
    • 也可以使用其他方案,如fasttext/simbert等
  • 当用户发来一个问题的时候,将问题同样转为向量,并检索向量数据库,得到相关性最高的一个或几个chunk
  • 将问题和chunk合并重写为一个新的请求发给openai api,可能的请求格式如下:

推荐一个库:llama-index (封装了先检索再整合的逻辑)

Agent

简介

简单来说:agent管理所有prompt、工具、LLM资源,三者结合实现自主开发。

展开来说:给定一个任务,AI Agent可以实现 LLM 与其他工具的组合、链路的嵌套等逻辑。利用提供的工具、LLM和带有CoT的prompt,实现自主开发、拆分子任务、决策子任务优先级、自己去寻找对应解决子任务需要的资源

例子:

相关产品

    1. LongChain Agent
    2. AutoGPT
    3. Microsoft Jarvis
    4. BabyAGI

效果

对LongChain Agent提问“五一假期从上海到东京哪一班航班最便宜?”

直接询问Chatgpt的结果

对AutoGPT提问“为即将到来的假期发明一道原创菜谱,并且保存到一个文件里。”

结果:https://github.com/Torantulino/Auto-GPT

原理

这边以LongChain Agent为例,其他agent的设计都类似。

agent管理所有prompt、工具、LLM资源,三者结合实现自主开发。

三要素:LLM、prompt、APIs

参考网上的一个例子来展开讲原理。

  • 任务:查询本周天气,以及十年后我多少岁,今年我28
  • Agent 返回结果:
  • 要素一:chatgpt
  • 要素二:prompt
  • 要素三:API

这里定义两个工具:WeatherTool、CustomCalculatorTool


 

  • 执行过程:
    • 通过这个prompt,加上我们的任务以及自定义的工具,会变成下面这个样子:

大集成

简介

集合各种应用

相关产品

    1. Microsoft Copliot
    2. 钉钉 x 通义千问


 

Answer the following questions as best you can.  You have access to the following tools: #  尽可能的去回答以下问题,你可以使用以下的工具:Calculator: Useful for when you need to answer questions about math.# 计算器:当你需要回答数学计算的时候可以用到
Weather: useful for When you want to know about the weather #  天气:当你想知道天气相关的问题时可以用到
Use the following format: # 请使用以下格式(回答)Question: the input question you must answer #  你必须回答输入的问题
Thought: you should always think about what to do # 你应该一直保持思考,思考要怎么解决问题
Action: the action to take, should be one of [Calculator, Weather] # 你应该采取[计算器,天气]之一
Action Input: the input to the action #  对工具需要输入什么内容
Observation: the result of the action # 工具的返回结果
...  (this Thought/Action/Action Input/Observation can repeat N times) # 思考-行动-输入-输出 的循环可以重复N次
Thought: I now know the final answer # 最后,你应该知道最终结果了
Final Answer: the final answer to the original input question # 针对于原始问题,输出最终结果Begin! # 开始
Question: Query the weather of this week,And How old will I be in ten years?  This year I am 28 #  问输入的问题
Thought:
    • 第一轮响应内容:
    • 第二轮响应内容:
    • 第三轮响应内容:
    • 直接使用chatgpt的结果:

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/18935.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

利用AI润色简历和模拟面试 - ChatCV

ChatCV是什么 chatCV是一个智能简历优化和面试模拟平台,它利用chatpt来分析用户的简历和职位要求,并让chatgpt站在专业的招聘经理的角度来给出建议和反馈。用户上传自己的简历后,就可以开始和AI对话了。AI会根据简历内容,提出修改…

〖程序员的自我修养 - 精炼面试篇③〗- 如何通过「自我介绍」更好的推销自己

简介:应 850 小伙伴要求, 无论你是迷茫的在校生还是已经就业的老司机,该专栏都值得你订阅,它会让你成就更好的自己!说明:该文属于 程序员的自我修养 专栏,购买任意白宝书体系化专栏可加入易编程…

对接腾讯广告平台系统开发(半自动化广告投放系统)

这是我最近刚弄完上线的一套比较有意思的比较大型的系统,因此特意记录一下。 先说这套玩意获得的效果:竞品的投放团队运营团队就算有一百个人,天天996,007加班不睡觉,投放效率也没有我们四五个人的高,这个…

ChatGPT 会取代人的哪些工作?哪些人群的职业规划需要转变?

ChatGPT 会取代人的哪些工作?哪些人群的职业规划需要转变? 作为一个人工智能,ChatGPT 可以用于许多自动化和智能化的工作领域。以下是 ChatGPT 可能会取代人的一些工作: 客服和客户支持:ChatGPT 可以接管一些基本的客户…

怎样写毕业论文的开题报告和任务书?

在开始一份毕业论文之前,任务书和开题报告是每一位同学都绕不开的,总有小伙伴为此头疼不已。为了让大家清楚地了解到什么是毕业论文的开题报告和任务书,以及如何写好开题报告和任务书,我总结了一篇大约2000字的文章,将…

开题报告的选题依据怎么写?

宝子们!是不是导师在催你的开题报告啦~导师给你选了一个选题,是不是你还没琢磨好这个选题想表达点啥?到底有什么依据选这个选题?选题依据由什么组成?且先不说如何把选题写的足够出彩,但能不能找到一个合适的…

论文开题报告怎么写?

同学们,是不是又到了一年一度写开题报告的时候呀?是不是还在为不知道论文的开题报告怎么写而苦恼? Take it easy!我带着倾尽我所有开题报告写作经验总结出来的最强保姆级开题报告解说来啦,一定让你脱胎换骨,顺利拿下开题报告这个…

开题报告中的研究目的与研究内容怎么写?

导师帮你选好题目以后,是不是自己也还在纠结到底怎样快速先明确出整个初稿的内容和结论呢?开题报告的研究目的和研究内容怎么样才能被导师一眼看中呢?别犯愁啦~这一篇保准手拿把掐地教会你!一起往下看看吧~ 这里是小目录喔~&#…

基于微信小程序的相关管理系统设计与实现开题报告的思路及方法

今天主要谈一下计算机科学相关专业同学的选题的思路及方法。 毕业设计选题选没选好就像各位走出校园踏进社会的一道坎,跨过这道坎是很关键的,而有些同学却犯了难,把本应该简单的问题复杂化了。为什么这样讲呢?之前就有同学找到我们…

开题报告写作攻略--概述及国内外研究现状

本人所在院校开题报告需要的模块如下图所示。 一、论文标题四要素 ① predicts content 预示研究内容; ② Interesting 吸引读者兴趣; ③ Reflects tone反映作者的语气; ④ Important keywords关键字。 注意事项: 尽量缩短题…

大学社团管理系统——开题报告

大学社团管理系统 学生姓名:王一一 班级:软件工程1612 指导教师:黄X 一、本课题研究(开发)的目的和意义。 现如今大学社团各式各样的都有,学校对社团的管理手段处于落后阶段&#xff…

开题报告的国内外研究现状怎么写呢?

大家都知道国内外研究现状在整个毕业论文中的作用是非常重要的,只有选择强有力的文献综述才能给我们的开题报告和论文提供高专业性的理论支撑。那么关于开题报告的国内外研究现状该怎么写呢?我们该去哪里找到与本研究课题相关的资料呢?是应该…

TCP速率与窗口,带宽,RTT之间的关系

转自:http://blog.csdn.net/bad_sheep/article/details/6158676 以下部分内容是自己的理解,可能会有差错,如有发现,欢迎指正。 窗口: TCP是一个滑动窗口协议,即一个TCP连接的发送端在某个时刻能发多少数据是…

.NET 7 新增速率限制 (Rate Limiting) 功能,轻松限制请求数量

.NET 7 内置了速率限制(Rate Limiting)功能,速率限制指的是限制可访问资源的请求数。例如数据库每分钟可以安全处理 1000 个请求,再多不确定会不会崩。这时就可以在应用程序中放一个速率限制器,规定每分钟只允许 1000…

天津到广州海运货柜船期

天津到广州海运,一般的集装箱运输路线是从天津新港走船到广州南沙港,有直达的船,运输时间一个星期,集装箱大柜或者小柜,每周从天津发出的船有4班左右。

GPT-4原论文详细解读(GPT-4 Technical Report)

GPT-4原论文详细解读(GPT-4 Technical Report) 返回论文和资料目录 1.导读 相比之前的GPT-3.5等大型语言模型(这里可以看我的InstructGPT解读,也方便理解本文内容),GPT-4最大的不同在于变成了多模态&…

IBM加入战局!任意大模型低成本变ChatGPT方法开源,个别任务超GPT-4

衡宇 发自 凹非寺量子位 | 公众号 QbitAI 科幻中有机器人三原则,IBM说不够,要十六原则。 最新大模型研究工作中,以十六原则为基础,IBM让AI自己完成对齐流程。 全程只需300行(或更少)人类标注数据&#xff0…

git获取ssh密钥

桌面右击,选择 “Git Bash” 切换到 .ssh 路径下,如果不存在,则直接创建一个(本人在家目录即用户目录下) 添加用户名和密码 使用下面的命令创建ssh密钥 ssh-keygen一路回车即可 此时.ssh文件夹下便会包含两个文件&…

作为一名开发工程师,我对 ChatGPT 的一些看法

ChatGPT 又又火了。 ChatGPT 第一次爆火是2022年12月的时候,我从一些球友的讨论中知道了这个 AI 程序。 今年2月,ChatGPT 的热火更加猛烈,这时我才意识到,原来上次的热火只是我们互联网圈子内部火了,这次是真真正正的破圈了,为大众所熟悉了。 这个 AI 程序是一个智能问…

新版Web of science 如何导出全记录与引用的参考文献到Hisecite

Question: 我导开“查”文献科研培训会的时候提到Hisecite文献引用分析软件,在看录频的时候顺便了解这个软件,遇到了一个问题:目前网上关于hisecite的参考资料很多都是关于旧版WOS(Web of Science),本人经过翻阅资料&…