【LangChain】如何本地部署基于chatGPT的实时文档和表格数据的助手,在自己的数据上构建chatGPT?

【LangChain】如何本地部署基于chatGPT的实时文档和表格数据的助手,在自己的数据上构建chatGPT

1 相关技术

(1)LangChain 是一个用于自然语言处理的 Python 库,它的目标是尝试简化自然语言处理任务,提高处理效率和准确性。

该库提供了一组易于使用的函数和工具,可以帮助你实现各种自然语言处理任务,例如语句分割、分词、词性标注、命名实体识别、情感分析等。与其它自然语言处理库相比,LangChain 更注重处理速度和准确性,并且支持多种自然语言的处理(包括中文、英文、日文等)。

(2)FAISS 是LangChain工具箱中的一个用于高效相似度搜索的 Python 库,它基于压缩和向量量化的算法实现了非常快速的相似度搜索。它特别适用于处理高维向量集合,例如图像、音频和自然语言处理中的向量表示等。

2 项目原理

首先读取pdf或者csv文件,使用LangChain的方法嵌入和矢量存储起来,称为Vectorstore。当用户提问新问题时,将当前新问题和之前的对话内容(上下文内容)整合成一个新的问题(Stanalone Question),利用chatGPT中查找答案得到文本1,同时使用相似度匹配方法,从Vectorstore中获取相似的文本内容,得到文本2。最终是将文本1和文本2,再用chatGPT总结,得出最终的答案。

在这里插入图片描述

3 项目搭建

(1)安装环境

conda create -n chat python=3.9

(2)安装包

pip install streamlit streamlit_chat langchain openai faiss-cpu tiktoken -i https://pypi.tuna.tsinghua.edu.cn/simple

(3)下载源码

git clone https://github.com/yvann-hub/Robby-chatbot.git

(4)安装依赖,如果报错,某个包有依赖问题,请先卸载这个包,重新安装一遍就可以。

cd Robby-chatbot

pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple

(5)配置OPENAI_API_KEY全局变量(非必要,可以在界面输入,配置后就不需要再界面输入)

Mac os或者LInux环境下,在~./bash_profile配置文件中配置

vim ~/.bash_profile

输入并保存退出,注意,“OPENAI_API_KEY=”中的 字母和等号之间是没有空格的。

export OPENAI_API_KEY= “你的key,从OenAI官网获取”

刷新配置生效

source ~./bash_profile

为了让以上变量永久生效,在~/.zshrc中配置以下内容

vim ~/.zshrc

在最后一行填入:source ~./bash_profile,再刷新文件

source ~/.zshrc

(6)修改源码中的部分代码

打开src/modules/utils.py中的

if os.path.exists(“.env”) and os.environ.get(“OPENAI_API_KEY”) is not None:

改为

if os.environ.get(“OPENAI_API_KEY”) is not None:

(6)运行项目

streamlit run src/robby_chatbot.py

在这里插入图片描述

此时加载自己的数据文件,就可以实现对当前数据集的数据进行提问。

目前的体验,相似度算法、token限制等问题,相似度匹配返回的文本再丢给GPT时,这过程中,是一个传统的相似度匹配算法过程,能力有限,并不能有效的去替代真正的用数据训练过的GPT。当提出的问题,在向量库中没有找到相似的内容时,最终的答案是无(有就是有,没有就是没有),不会像原始GPT一样,无论如何都会给出一个答案(甚至编造)。

4 参考资料

  1. https://betterprogramming.pub/build-a-chatbot-on-your-csv-data-with-langchain-and-openai-ed121f85f0cd

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/2054.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

ChatGPT一键私有部署,全网可用,让访问、问答不再受限,且安全稳定!

前言 ChatGPT由于在访问上有一些限制,使用并不便利。目前国内可以直接访问的大部分是调用API返回结果,我们去使用时总会有次数限制,而且它们可能随便崩掉。 其实,目前我们访问过的大部分国内的网页包括UI,其实是套用了…

快速部署个人-ChatGPT Next Web

前提:要有梯子、谷歌账号。 目录 一、源码地址: 二、演示地址: 三、获取API密钥 四、 部署 五、重新部署 六、无梯子访问 一、源码地址: GitHub - Yidadaa/ChatGPT-Next-Web: One-Click to deploy well-designed ChatGP…

docker部署chat-web,实现自己的ChatGPT

本篇文章的前提是请确认已获得openai 的API-KEYS,即以sk-开头的keys;是否在服务器上安装了docker以及docker-compose docker以及docker-compose安装请参考我的博文:CENTOS8.0安装DOCKER&DOCKER-COMPOSE_wd520521的博客-CSDN博客 一、&a…

本周热门chatGPT之AutoGPT-AgentGPT,可以实现完全自主实现任务,附部署使用教程

AutoGPT 是一个实验性的开源应用程序,它由GPT-4驱动,但有别于ChatGPT的是,​ 这与ChatGPT的底层语言模型一致。 ​AutoGPT 的定位是将LLM的"思想"串联起来,自主地实现你设定的任何目标。 简单的说,你只用提出…

ChatGLM 本地部署搭建及测试运行

这篇简要说下清华开源项目 ChatGLM 本地部署的详细教程。清华开源项目 ChatGLM-6B 已发布开源版本,这一项目可以直接部署在本地计算机上做测试,无需联网即可体验与 AI 聊天的乐趣。 项目地址:GitHub - THUDM/ChatGLM-6B: ChatGLM-6B&#xf…

部署了一个ChatGPT

部署了一个ChatGPT ChatGPT火爆了一段时间了,但是基于一些不可描述的原因,不能注册使用。为了方便大家体验,我部署了一个服务,能简单地体验一下ChatGPT的强大。话不多说,直接展示几个例子截图。文章最后放上体验地址和…

一键部署自己的ChatGPT!

昨晚咱们群友推荐了一个叫做ChatGPT-Next-Web项目,可以一键免费部署你的私人 ChatGPT 网页应用。 今早起来尝试了下,整体过程非常丝滑,觉得有必要推荐给大家。 项目整体是基于Vercel平台开发的,只要提供api key,即可在…

史上最简单的自建ChatGPT部署方案,只需要一个HTML文件

今天发现一个史上最简单的自建ChatGPT部署方案,只需要一个HTML文件,把它配置到Nginx就能跑起来。 效果如下: 他能做什么用? 平常我们使用chatgpt需要配魔法上网才能登上官方网站,对于很多人来说这是个很棘手的问题&a…

【ChatGPT本地部署-- ChatGLM】

这里写自定义目录标题 ChatGPT本地部署--- ChatGLM(转载)一、什么是ChatGLM?二、本地部署三、模型与ChatGPT和GPT4AII 效果对比 ChatGPT本地部署— ChatGLM(转载) 目录 一、什么是ChatGLM? 二、本地部署 2.1 模型下载 2.2 模型部署 2.3 模型运行 …

跟AI唠嗑,年入33万美金!ChatGPT时代的必备新技能

编|好困 Aeneas源|新智元 AI在我们的生活中,越来越不可或缺。显然,谁能更好地掌握提示工程,就能比别人多掌握一个强大的利器。 ChatGPT的爆火,也让提示工程师的薪水水涨船高。 现在,已经有人拿到…

如何利用ChatGPT搞科研?

这位研究僧,GPT-4都发布了,你还在纯人工搞科研吗? 已经有人实测: ChatGPT科研全流程都能用,尤其是对于 英语非母语的科研人员,可以极大地提高日常科研工作效率。 连写给导师的请假信,都能编得有…

你应该知道的ChatGPT提示语

ChatGPT 自上线以来,凭借其优异的自然语言理解和输出能力,仅花 5天就成为了活跃用户过百万的现象级产品。而上一个现象级产品 instagram 花了 2 个半月。到目前为止 ChatGPT 在全球累计用户数量已经过亿,相信现在也有很多人在跟 ChatGPT 聊过…

真诡异,ChatGPT 竟让知乎股价暴涨

大家好,我是校长。 今天一大早,看到一条新闻:2 月 8 日,知乎涨幅扩大至超 50%,股价创新高,报 34.8 港元。 根据中银国际发表的研究报告所说,ChatGPT 注册用户激增,AIGC 潜力巨大&…

刷榜GitHub!中科院学术科研专用版 ChatGPT开源了!斩获24K star。。论文润色、语法检查,一键搞定!...

最近,一位开发者在GitHub上开源的「科研工作专用ChatGPT」项目大受好评。论文润色、语法检查、中英互译、代码解释等等一键搞定。这个项目就是「中科院学术专业版 ChatGPT」。 自从ChatGPT发布之后,各路大神都开始研究如何把它加入到自己的「科研工作流」…

【ChatGPT进阶】如何使用ChatGPT做知乎好物?

如果你想通过知乎赚钱,知乎好物是一个不错的选择,门槛很低,而且是一个可以长期“躺赚”的项目,如果你会ChatGPT的话,可以去卷同行。 知乎好物是什么? 知乎好物是一种在知乎平台上创作内容或回答问题时&am…

干货|如何更好地使用ChatGPT,请从与它的第一句对话开始

ChatGPT是一个强大的人工智能助手,它可以提供各种问题的解答和建议。因此,在使用ChatGPT时,了解如何向它提问、如何与它互动以及如何获得最有价值的回答变得尤为重要。本文旨在为您介绍如何较好地开启与它的第一句对话,以更好地探…

ChatGPT帮我写了个方案

文章目录 ChatGPT会不会导致程序员失业2023年做什么生意赚钱Java开发面试自我介绍 废话不多说,先看录屏 体验后我惊呆了,一时不知如何形容这该死的功能 然后我又问了大家都在讨论的的问题 ChatGPT会不会导致程序员失业 失业倒不至于,但是像…

知乎精选 | ChatGPT与数学优化

来源:运筹or帷幄‍‍‍ 本文约2200字,建议阅读9分钟 ChatGPT的准确性和速度以及处理复杂任务的能力使其成为一种非常有用的工具。 作者信息:宋志刚,中国科学院大学物理学博士 一、引言 ChatGPT是一个由OpenAI训练的大型语言生成模…

小孩都能学明白ChatGPT的AI读物,给你们看一眼,就一眼

衡宇 发自 凹非寺量子位 | 公众号 QbitAI 小区底层面馆旁新开了家幼儿ChatGPT培训班。ChatGPT的火热,又拱起了一波关于AI学习的焦虑。 AI 2.0时代,不想掉队的人,不只自己狠狠恶补,还从AI Native的娃娃开始抓起。 不妨一起以小见大…

ChatGPT专业应用:批量生成知乎回答

正文共 930字,阅读大约需要 7 分钟 数字/内容营销市场人群必备技巧,您将在7分钟后获得以下超能力: 1.批量生成知乎答案 2.多元化产出内容 Beezy评级 :B级 *经过简单的寻找, 大部分人能立刻掌握。主要节省时间。 推荐…