基于闻达(wenda+chatGLM-6B),构建自己的知识库小助手

目录

安装miniconda

拉取仓库

使用内置python

安装依赖

上传模型

克隆及下载 text2vec-large-chinese

修改配置

上传知识库(txt文件)

处理txt数据

启动服务

测试


ChatGLM-6B是清华团队+智谱AI开发的,一个开源的、支持中英双语的对话语言模型,具有 62 亿参数。被很多人视为ChatGPT的平替。但是由于ChatGLM-6B 的规模较小,目前已知其具有相当多的局限性。解决这一问题的方式大体上有两种:

一种是使用更大规模的模型来提升整体能力,提升其自我认知能力。开发者表示基于 1300 亿参数 GLM-130B 的 ChatGLM 已经在内测开发中。

另一种便是使用插件或者外挂的方式,提升模型在某一个领域的能力。

wenda就属于后者,wenda是一个大规模语言模型调用平台。旨在通过使用为小模型外挂知识库查找的方式,实现近似于大模型的生成能力。

既然我们已经了解 wenda 的作用,快让我们进入正文吧!

我的文件目录结构

 # 闻达路径(我的路径为nogit,以下图片中nogit路径理解为wenda即可)/home/user/data/wenda# miniconda路径/home/user/data/miniconda3

安装miniconda

 # 进入路径cd /home/user/data/

从 https://pan.baidu.com/s/1w33G8xp66Q6kwLN6pDC_3A?pwd=dim9 提取码: dim9

下载 Miniconda3-latest-Linux-x86_64.sh,将下载好的文件放入 /home/user/data/ 路径下

 # 安装minicondash Miniconda3-latest-Linux-x86_64.sh

安装完成后查看是否成功

 cd miniconda3/bin./conda -V

显示如下表示安装成功

拉取仓库

进入  /home/user/data/ 路径下

 cd /home/user/data/
 # 拉取仓库git clone https://github.com/l15y/wenda.git

使用内置python

 # 进入wenda目录cd /home/user/data/wenda
 # 使用conda命令创建内置python环境/home/user/data/miniconda3/bin/conda create -p ./env python=3.8

安装依赖

env/bin/pip install -r requirements/requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple
env/bin/pip install torch BeautifulSoup4 torchvision torchaudio pdfminer.six -i https://pypi.tuna.tsinghua.edu.cn/simple
env/bin/pip install -r requirements/requirements-chatglm.txt -i https://pypi.tuna.tsinghua.edu.cn/simple
env/bin/pip install -r requirements/requirements-st.txt -i https://pypi.tuna.tsinghua.edu.cn/simple
env/bin/pip install -r requirements/requirements-rwkv.txt -i https://pypi.tuna.tsinghua.edu.cn/simple
env/bin/pip install -r requirements/requirements-bing.txt -i https://pypi.tuna.tsinghua.edu.cn/simple
env/bin/pip install -r requirements/requirements-glm6b-lora.txt -i https://pypi.tuna.tsinghua.edu.cn/simple
env/bin/pip install -r requirements/requirements-gpt4free.txt -i https://pypi.tuna.tsinghua.edu.cn/simple
env/bin/pip install -r requirements/requirements-fess.txt -i https://pypi.tuna.tsinghua.edu.cn/simple
env/bin/pip install -r requirements/requirements-llama.txt -i https://pypi.tuna.tsinghua.edu.cn/simple
env/bin/pip install -r requirements/requirements-openai.txt -i https://pypi.tuna.tsinghua.edu.cn/simple
env/bin/pip install -r requirements/requirements-qdrant.txt -i https://pypi.tuna.tsinghua.edu.cn/simple

上传模型

我使用的模型是chatGLM-6B,大家也可以使用其他的基础模型

链接:https://pan.baidu.com/s/16L7K-2pa5EfXzcUOJEBJLA?pwd=xt9l 提取码:xt9l

下载完成后上传到 /home/user/data/wenda 路径

解压文件

 cd /home/user/data/wenda7z x -y model.7z -o/home/user/data/wenda

注意,解压后的文件路径是否为 /home/user/data/wenda/model/chatglm-6b,如果不是,请修改

如果没有7z命令,需要先安装7z命令,如下:

 sudo apt install p7zip-full p7zip-rar

克隆及下载 text2vec-large-chinese

cd /home/user/data/wenda/model
# 安装 git lfs
git lfs install
# 如果报错 git: 'lfs' is not a git command.
# 执行如下(Ubuntu):
sudo apt-get install git-lfs# 从huggingface官网拉取模型指针文件
git clone https://huggingface.co/GanymedeNil/text2vec-large-chinese# 下载模型
wget https://huggingface.co/GanymedeNil/text2vec-large-chinese/resolve/main/pytorch_model.bin
# 覆盖text2vec-large-chinese中的 pytorch_model.bin文件
mv pytorch_model.bin text2vec-large-chinese/

修改配置

将example.config文件改名为config.xml

 cd /home/user/data/wenda/mv example.config.xml config.xml

修改config.xml文件

<!--模型类型修改:我用的是glm6b模型,所以此处修改为glm6b,大家看自己所用的模型是什么,修改即可--> <property><name>LLM_Type</name><value>glm6b</value><description>LLM模型类型:glm6b、rwkv、llama、chatglm</description></property><!--以下为模型位置修改,我用的是glm6b模型,所以修改此处GLM6B路径,位置为model/chatglm-6b,大家根据自己用的模型类型,修改config.xml对应位置即可--><GLM6B><property><name>Path</name><value>model/chatglm-6b</value><description>glm模型位置</description></property><property><name>Strategy</name><value>cuda fp16</value><description>glm 模型参数  支持:"cuda fp16"  所有glm模型 要直接跑在gpu上都可以使用这个参数"cuda fp16i8"  fp16原生模型 要自行量化为int8跑在gpu上可以使用这个参数"cuda fp16i4"  fp16原生模型 要自行量化为int4跑在gpu上可以使用这个参数"cpu fp32"  所有glm模型 要直接跑在cpu上都可以使用这个参数"cpu fp16i8" fp16原生模型 要自行量化为int8跑在cpu上可以使用这个参数"cpu fp16i4" fp16原生模型要 自行量化为int4跑在cpu上可以使用这个参数</description></property><property><name>Lora</name><value></value><description>glm-lora模型位置</description></property></GLM6B>

上传知识库(txt文件)

创建txt文件夹

 cd /home/user/data/wenda/mkdir txt

将自己的txt文件上传到这里

我的txt如下

 中国管理案例共享中心案例库 教学案例1案例正文:飞友科技人力发展何去何从摘要:飞友科技有限公司(以下简称“飞友科技”)创建于 2005 年,是目前国内最大的民航数据服务提供商。随着飞友科技 APP 下载量与 Association for ClinicalData Management (A-CDM)系统机场覆盖率的大大提升,飞友科技目前正以高速发展趋势拓展业务领域,基于公司发展战略的调整,人力资源部门在完善管理体系的过程中出现了障碍:1.合肥是相对落后的城市,人力资源部门在本地招聘困难;2.人力资源部门人员不稳定、流动性大,无法保证高效运作进而支持其他部门工作。本案例通过介绍飞友科技人力资源部门发展现状,启发案例使用者运用战略性人力资源管理等理论知识分析公司人力资源现状背后的原因,为公司人力资源部门的发展在未来如何适应公司及外部环境提出建议。关键词:IT 产业,高端人才招聘,人力资源管理,团队建设0 引言近年来,随着交通运输业的蓬勃发展, 生活节奏越来越快,飞机成了人们出差旅行首选的快捷出行方式,中国航空市场也快速从原来的公务出行市场转化为个人出行市场。但是,由于各种自然非自然原因,航班延误,飞行取消及中转停留等,也为乘客出行造成了不便,毕竟不是所有飞机都能风雨无阻按时起飞停降。民航业,作为服务产业,面对竞争日益激烈的市场,如何为客户提供高速便捷的出行服务,成为他们成功的关键。在大环境互联网+及大用户手机网民+的背景下,“飞常准”APP 就这样应运而生了。正是这样一款方便快捷的航空服务 APP,在你面对查询订票的繁琐流程以及突发情况时,帮助你更合理的安排时间,顺利起飞。

处理txt数据

/home/user/data/wenda/env/bin/python3 /home/user/data/wenda/plugins/gen_data_st.py

启动服务

 /home/user/data/wenda/env/bin/python3 /home/user/data/wenda/wenda.py

测试

未开启知识库,只使用chatglm-6b模型

开启知识库,如下:

以上便是本次搭建的全部过程啦

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/22217.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

用离散数学知识对AI最难替代的职业进行数学建模,推导证明出最难被AI替代的职业是什么

摘要&#xff1a; 本文基于离散数学的知识&#xff0c;对人类智力劳动的职业进行数学建模&#xff0c;并推导出最难被AI替代的职业。通过对职业的分析&#xff0c;本文认为&#xff0c;应该运用离散数学中的图论知识对AI替代各种人类职业的难易进行数学建模&#xff0c;从中寻找…

与2017年度两位图灵奖得主的虚拟对话

【新一届图灵奖即将揭晓&#xff0c;在此与大家分享撰写的2017年度两位图灵奖得主的故事。本文于2018年3月28日完稿&#xff0c;发表于《中国计算机学会通讯》2018年第4期。】 2017年度的计算机领域最高奖“图灵奖”终于揭晓——斯坦福大学的约翰●轩尼诗&#xff08;John Henn…

这把小刀怎么用——详解Knife4j框架

目录 介绍 使用步骤 1.在maven中添加依赖 2.添加其配置类&#xff0c;可以放在项目其他框架的配置类包中 3.application.properties中添加配置 介绍 Knife4j是为Java MVC框架集成Swagger生成在线Api文档的增强解决方案,其前身是swagger-bootstrap-ui&#xff0c;此框架还有调…

Emlog插件小刀娱乐网同款文章顶踩源码

介绍&#xff1a; Emlog小刀娱乐网同款顶踩插件免费发布 前些天看到小刀娱乐网的文章页面有了一些变化&#xff0c;那就是增加了一个有价值/无价值的顶踩按钮。 样式也是非常的好看 再加上两个表情包是非常的有趣。 网盘下载地址&#xff1a; http://kekewl.org/HGAmnmx7pAC0…

一把小刀,直插 class 文件的小心脏

大家好&#xff0c;我是二哥呀&#xff0c;假期结束了&#xff0c;学起来吧&#xff01; 今天我拿了一把小刀&#xff0c;准备解剖一下 Java 的 class 文件。 CS 的世界里流行着这么一句话&#xff0c;“计算机科学领域的任何问题都可以通过增加一个中间层来解决”。对于 Jav…

emlog仿小刀模板

简介&#xff1a; 此模板是模仿小刀的模板&#xff0c;修改首页左广告图下内容&#xff0c;比之前更实用。修复无法搜索以及标签问题。删除文章页千篇一律的免责声明。添加右侧投稿和top悬浮标&#xff0c;可以和之前的top共存。友链中的部分链接可以在module.php修改。最近更…

高仿小刀娱乐网系统源码+积分功能+前台投稿

简介&#xff1a; 前台带会员投稿审核&#xff0c;收藏等功能&#xff0c;后台有插件&#xff0c;可扩展支持支付等&#xff0c;功能齐全。 用(极致CMS)套的模板&#xff0c;免费商用的CMS&#xff0c;可以自定义二开功能&#xff0c;附带积分功能&#xff01; 安装教程&#…

Android——教你10分钟手敲 Butter Knife(小刀注解)

教你10分钟手敲 Butter Knife(小刀注解) 在用 AndroidStudio 集成 Butter Knife(小刀注解)的时候感觉像极了J2EE的Spring IOC容器 自己研究了一下&#xff0c;我来分享一下&#xff0c;小编会&#xff1a;多注释&#xff0c;多贴码&#xff0c;尽量降低同学们的学习时间成本&am…

最新织梦程序精仿小刀娱乐网资源网主题模板源码

介绍&#xff1a; 当初花了300块买的一套源码&#xff0c;跟小刀同款一模一样&#xff0c;仿的大鹏资源网 网盘下载地址&#xff1a; https://zijiewangpan.com/NfH3vcZyxvf 图片&#xff1a;

小刀娱乐网源码2020版

简介&#xff1a; 小刀娱乐网源码是aspaccess/mssql架构网站系统&#xff0c;电脑版&#xff0c;手机版&#xff0c;平板版无缝切换&#xff0c;一个后台同步管理&#xff0c;整站生成静态利于搜索收录&#xff0c;dreamweaver打开可视化修改。 专为制作“小刀娱乐网、QQ教程…

最新精仿小刀娱乐资源网模板源码,带前台会员投稿审核功能

介绍&#xff1a; 安装方法一&#xff1a; 1、将根目录文件上传服务器 2、将根目录1x6d.sql导入mysql数据库 3、环境需要支持PHP5.6&#xff08;推荐PHP7.2&#xff09;&#xff0c;mysql5.0 4、配置数据库Conf/config.php 填写数据库账户密码 5、删除根目录安装文件install …

新版仿小刀资源网模板—木鱼cms

介绍&#xff1a; 仿小刀资源网模板新鲜出炉&#xff0c;使用的是muyucms 仿小刀资源网页面 1比1还原 这套模板使用了全新的轻量cms系统 木鱼cms 网盘下载地址&#xff1a; http://kekewl.net/38Bsc80j7460 图片&#xff1a;

晗枫emlog仿小刀网修复版模板

介绍&#xff1a; 晗枫开源的emlog仿小刀HFdao模板&#xff0c;测试之后和小刀网的没什么差别&#xff0c;EMLOG用户的福利模板&#xff0c;全开源免费发布。 JS各大搜索引擎自动提交收录&#xff01; 最后如果自己二开请留个版权作者开发不易&#xff0c;不做伸手党&#xff…

php小刀娱乐网源码,PHP精仿小刀娱乐网资源下载站网站整站源码

【温馨提示】源码包解压密码&#xff1a;www.youhutong.com 资源描述 PHP精仿小刀娱乐网资源下载站网站整站源码 源码介绍&#xff1a; 网友花了300多元买的源码。 该源码使用dedecms系统去仿小刀娱乐网资源下载站一套源码模板&#xff0c;安装简单。非常适合做资源素材站用。 …

emlog程序仿小刀娱乐网模板最终版本分享

介绍&#xff1a; 上个版本本次修复广告横幅只显示大图的问题&#xff0c;修复文字广告在手机不显示文章置顶广告移除热门&#xff0c; 现在不在热门显示了修复免责一类&#xff0c;关于这些&#xff0c;不再是看文章那种了左侧大图轮播去掉&#xff0c;不在显示箭头&#xff…

Emlog程序小刀娱乐网同款顶踩插件

介绍&#xff1a; 插件适用于EMLOG&#xff0c;插件仿的小刀娱乐网插件。 没个样式也非常好看加上两个表情包 很有趣&#xff0c;就插件已经适用Emlog系统了&#xff0c;效果还不错&#xff01; 将压缩包里的digg文件上传到你emlog的插件目录下即可 然后在echo_log.php文章页的…

emlog高仿小刀新版本模板

介绍&#xff1a; 此模板是模仿小刀的模板&#xff0c;修改首页左广告图下内容&#xff0c;比之前更实用。 修复无法搜索以及标签问题。 删除文章页千篇一律的免责声明。 添加右侧投稿和top悬浮标&#xff0c;可以和之前的top共存。 友链中的部分链接可以在module.php修改。 最…

最新emlog程序仿小刀模板源码

介绍&#xff1a; 此模板是模仿小刀的模板&#xff0c;修改首页左广告图下内容&#xff0c;比之前更实用。 修复无法搜索以及标签问题。 删除文章页千篇一律的免责声明。 添加右侧投稿和top悬浮标&#xff0c;可以和之前的top共存。 友链中的部分链接可以在module.php修改。 最…

EMLOG插件采集小刀模板

介绍&#xff1a; 插件目前支持采集&#xff0c;只需输入网站文章地址&#xff0c;然后绑定你自己网站的分类ID就行了。 网盘下载地址&#xff1a; http://kekewangLuo.net/uP8ixoLc0k4 图片&#xff1a;