基于自定义知识库回答问题的ChatGPT-

前言

ChatGPT是一个强大的语言模型,利用大规模的自然语言处理和机器学习算法,可以进行自然而流畅的对话,理解自然语言问题和回答,相信在座各位,尤其是程序员的你,肯定不可能还没使用过ChatGPT。

ChatGPT能做的事包括但不限于:

  • 学术论文
  • 生成代码
  • 创意写作
  • 翻译
  • 简历和求职信

它能够生成类似于人类写作的文本。您只需要给出提示或提出问题,它就可以生成你想要的东西。但其实你用过ChatGPT就会知道,在我们想要得到准确、具体的回答时,我们的prompt是十分重要的。

什么是 Prompt(提示)?

简单的理解它是给 AI 模型的指令。

它可以是一个问题、一段文字描述,甚至可以是带有一堆参数的文字描述。AI 模型会基于 prompt 所提供的信息,生成对应的文本,亦或者图片。
在这里插入图片描述

例如这里prompt就是指我的问题“什么是csv文件”

好的prompt能够更好地发挥 AI 的能力。例如如果你想要AI帮你生成一篇文章,那你不如试试这么跟他说:

我想让你做一个AI写作导师。我将为您提供一名需要帮助改进其写作的学生,您的任务是使用人工智能工具(例如自然语言处理)向学生提供有关如何改进其作文的反馈。您还应该利用您在有效写作技巧方面的修辞知识和经验来建议学生可以更好地以书面形式表达他们的想法和想法的方法。我的第一个请求是“我需要有人帮我修改我的硕士论文”。

当然在这里我不是来介绍prompt的,如果你对这个感兴趣可以参考github的一个高星项目。

在该项目上提供了很多的有用的Prompts
https://github.com/f/awesome-chatgpt-prompts

至于为什么要了解prompt,待会你们就知道了。

Context(上下文)

ChatGPT最核心的功能之一,就是可以结合你之前的内容来回答你的问题,也就是具有上下文关联的能力。这也是ChatGPT拥有和用户多轮对话能力的基础。

chatgpt是不联网的,也就是他的数据是一直持续在一段时间之前的。如果你问到了ChatGPT的知识盲区,它大多时候并不会坦率的跟你说它不知道,而是开始自己胡编乱造,导致了你不知道这个ChatGPT什么时候会开始胡说。

当然我接下来并不是要介绍怎么让ChatGPT去联网接入网络获取信息,而是如果我有一个这样的需求,需要ChatGPT回答他的数据库里面没有的内容,该怎么做?

很多人会第一时间想到,在问问题之前通过上下文告诉他,让chatGPT可以结合上下文来回答我们的问题。

例如:我问蔡徐坤是谁?
在这里插入图片描述
这是ChatGPT的回答,其他的内容我不清楚,但是我家哥哥的真正的出生地是 浙江省温州市,户籍湖南吉首。很明显GPT的回答是错误的。

但是如果在问蔡徐坤是谁之前,先提供给他蔡徐坤的百度百科资料,像这样:

在这里插入图片描述

可以看见有了上下文的支持,chatGPT可以从上文得知我家咯咯的具体信息,但是这个方法有一个很大的局限性。目前 ChatGPT 有个非常大的限制,它限制了最大的 token 数是 4096,注意这个是(请求+响应)<4096,就是你的问题加上ChatGPT的回答不能超过一定的字符。

在这里插入图片描述
具体的token计算比较复杂,这里可以简单的认为2 token约等于1个中文字符。

可想而知,随便一个长点的前置内容都会让tokens超过限制。

于是官网给出了2个相对的解决方案。

  1. 词嵌入(embedding)
  2. 微调模型(Fine-tuning)

1.微调模型(Fine-tuning)

官网的描述是这样的:
在这里插入图片描述

简单来说,微调模型更适合去处理一些分类相关的工作,根据你提供的大量的数据集,来对prompt进行一个分类。并不是能很好的满足我们的需求,并且微调模型需要提供大量数据集。

2.词嵌入(Embedding)

什么是词嵌入?其实我也不是很懂,简单来说就是可以把一段话抽象成为矢量数据。

那我们要做基于自定义知识库回答问题的ChatGPT应该要怎么做呢?

首先我们将我们要构建成自定义知识库的文本,先通过词嵌入转化为一大堆的矢量数据,然后同时再将我们问题通过一样的方法转化为矢量,通过计算每个文章的词向量与问题词向量之间的相关性,我们将相关性最高的 一部分自定义知识库的文本加上你的问题,构成的prompt来去提问ChatGPT获得回答。

这里是官网的一个demo

https://platform.openai.com/docs/tutorials/web-qa-embeddings

我们根据官网给出的代码来讲解。

在这里插入图片描述
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/4419.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

热点|ChatGPT到底是什么,ChatGPT给通信行业带来什么影响

最近这段时间&#xff0c;ChatGPT火爆全网&#xff0c;引发了整个社会的强烈关注。 这个来自OpenAI公司的聊天机器人&#xff0c;表现出了极为逆天的人工智能水平&#xff0c;让所有人为之震惊。 其实&#xff0c;对人工智能&#xff08;以下简称“AI”&#xff09;的能力&…

A股市场上股票行情数据接口有那几种?

L2行情数据接口相比Level-1接口相比&#xff0c;L2行情市场具有数据更完整、推送速度更及时的优势&#xff0c;帮助投资者及时把握盘中主要资金流&#xff0c;做出更准确的投资决策。简而言之&#xff0c;Level-2最大的作用就是提前看到主力的大单&#xff0c;对于追逐日线跌停…

A股最新高频行情数据

A股1min/5min行情数据 A股2005-2022高频行情数据 TAGS: A股行情数据、1分钟行情数据、A股数据 【亲测可用&#xff0c;包含了2005-2021年的1分钟和5分钟数据&#xff0c;2022年正在同步1个月更新一次】 详情请见&#xff1a; 链接&#xff1a;https://pan.baidu.com/s/1Kw29…

新浪实时股票接口大全

股票数据的获取今朝有如次两种要领可以获取:  1. http/javascript接口取数据  2. -service接口   1.http/javascript接口取数据   1.1Sina股票数据接口   以大秦铁路&#xff08;股票&#xff1a;601006&#xff09;为例&#xff0c;如果要获取它的最新行情&#x…

新浪股票行情数据接口有什么作用?

通过新浪股票行情数据接口可以让投资者在实际交易当中能够更加精准的洞悉盘口变化。该接口可以说是目前最好用的免费股票行情数据接口了&#xff0c;虽然一直并未公开&#xff0c;但暂时使用良好。大家用浏览器访问新浪的股票行情数据接口就能查看最新行情数据了。那么今天小编…

聚观早报 | 苹果2024年放弃高通;腾讯回应进军类 ChatGPT

今日要闻&#xff1a;苹果2024年放弃高通&#xff1b;腾讯回应进军类 ChatGPT&#xff1b;小米发布无线AR眼镜探索版&#xff1b;50%的美国企业已在使用ChatGPT&#xff1b;Snap推出ChatGPT驱动的聊天机器人 苹果2024年放弃高通 高通公司 CEO 兼总裁克里斯蒂亚诺・安蒙&#…

对话ChatGPT:Prompt是普通人“魔法”吗?

在ChatGPT、Midjourney、Stable Diffusion等新事物的作用下&#xff0c;不少人或多或少听说过Prompt的概念。 虽然OpenAI掀起的大模型浪潮再度刷新了人们对AI的认知&#xff0c;但现阶段的AI终归还不是强人工智能&#xff0c;大模型里的“知识”存储在一个隐性空间里&#xff0…

ChatGPT 开始摧毁在线教育公司;与苹果、迪士尼和网飞纠纷中美国编剧协会罢工;英伟达将在今年进行 IPO;深度学习之父从谷歌离职;硅谷银行破产报告……《经济学人 | 第 19周》

ChatGPT 开始摧毁在线教育公司 The disruptive potential of generative artificial intelligence came into sharp focus when Chegg, a provider of online study aids, said that the use of ChatGPT by students was starting to affect revenues. 当在线学习辅助服务提供…

ChatGPT之狂飙之后,AI生态会面临洗牌?

我是Ai 一开始我们内部AI老友热议ChatGPT的时候&#xff0c;大家首先思考的是&#xff0c;ChatGPT怎么和搜索技术结合起来&#xff0c;它能颠覆搜索吗&#xff1f; 搜索是可追踪的&#xff0c;返回的每条结果都有记录&#xff0c;谈不上信息融合。ChatGPT是不可追踪的&#xff…

【ChatGPT】ChatGPT还能保持多久的神话?

文章目录 引言正文ChatGPT的由来ChatGPT的影响乱象频出ChatGPT未来的走势 引言 最近ChatGPT的热度持续拔高&#xff0c;一个功能强大的AI迅速引爆了全世界&#xff0c;上到技术大佬&#xff0c;下到平民百姓&#xff0c;都在讨论并使用这个“跨时代的”的技术。有人拿它聊天&a…

如何训练自己的ChatGPT

点击上方“芋道源码”&#xff0c;选择“设为星标” 管她前浪&#xff0c;还是后浪&#xff1f; 能浪的浪&#xff0c;才是好浪&#xff01; 每天 10:33 更新文章&#xff0c;每天掉亿点点头发... 源码精品专栏 原创 | Java 2021 超神之路&#xff0c;很肝~中文详细注释的开源…

哎,我要改行了!ChatGPT版Excel?动动嘴皮子就把表格改完了!

转自&#xff1a;机器之心报道 编辑&#xff1a;小舟、泽南 这就是 ChatGPT 进入 Excel 后的样子&#xff1f; Excel 是最常见的数据统计工具&#xff0c;用于归纳和查询数据信息。在其之上&#xff0c;通常我们查询信息需要找到相关的单元格&#xff0c;获取其中的数据&#x…

chatGPT即将取代你——chatGPT做技术调研

第一问&#xff1a;如何实现一个在线电子表格 要实现一个在线电子表格&#xff0c;您需要使用以下步骤&#xff1a; 选择一种编程语言和一个Web框架来创建您的应用程序。常见的Web框架包括Ruby on Rails、Django、Flask、Express等。您也可以选择使用现有的开源电子表格软件&…

玩转ChatGPT:Excel操作初探

一、写在前面 首先还是让小Chat推销下自己&#xff1a; Excel 表格制作是个技术活&#xff0c;你掌握了吗&#xff1f;没关系&#xff0c;现在有了 ChatGPT&#xff0c;让 Excel 辅助操作变得更简单&#xff01;再也不用苦恼于数据分析和整理了&#xff0c;让 ChatGPT 成为你…

用ChatGPT处理word表格数据:直接采用ChatGPt和利用ChatGPT编写python脚本两种方法

目录 摘要0. 测试数据生成1. 直接使用ChatGPT进行处理。2 使用ChatGPT生成python脚本进行处理3对比分析4 结束语 摘要 为测试ChatGP在word文档表格的处理能力&#xff0c;本文列举直接使用ChatGPT和利用ChatGPT编写python脚本两种方式&#xff0c;均比较容易的实现了预定目标。…

用ChatGPT做excel表格真香!只需动嘴提要求和复制粘贴

来源&#xff1a;量子位 前排提示&#xff1a;文末送书 托ChatGPT的福&#xff0c;梦想中让Excel自己统计数据&#xff0c;现在成真了。 △ 图源&#xff1a;抖音秦远国际物流 只需输入要求、数据&#xff0c;ChatGPT就能从头做个表。 想要增加行列、进行表内计算&#xff0c;通…

ChatGPT | Word表格整体输出

本文来自欧巴Godwin的博客 &#xff0c;引用必须注明出处&#xff01; 用LangChain读取Word和PDF的文字内容是好的&#xff0c;但如果内容包含表格则读取出来的内容完全没法看。用ChatGPT往往是做企业知识库&#xff0c;所以会出现一个场景&#xff0c;即员工想让ChatGPT讲解包…

postman发送post请求一直不成功

我的post请求方式 postman结果返回415 后台springboot拦截到的路径&#xff0c;此时发现url中存在error 解决方案&#xff1a; 第一步&#xff1a;添加头部 第二步&#xff1a;使用原生的json格式&#xff0c;点击send 返回的正确结果

Postman模拟大量请求

一、Postman Postman 是一个款 HTTP 请求模拟工具 二、请求演示 首先演示一下 Postman 最基本的使用&#xff0c;创建一个 Spring Boot 项目&#xff0c;测试的代码如下&#xff1a; import org.springframework.web.bind.annotation.GetMapping; import org.springframew…