通过容器启动QAnything知识库问答系统

QAnything (Question and Answer based on Anything) 是致力于支持任意格式文件或数据库的本地知识库问答系统,可断网安装使用。目前已支持格式:PDF(pdf)Word(docx)PPT(pptx)XLS(xlsx)Markdown(md)电子邮件(eml)TXT(txt)图片(jpg,jpeg,png)CSV(csv)网页链接(html)等格式。

一.后端启动

1.run.sh命令启动

因为显卡配置原因,没有使用Qwen-7B-QAnything模型,而使用了MiniChat-2-3B模型,启动命令bash ./run.sh -c local -i 0 -b hf -m MiniChat-2-3B -t minichat。其中参数物理意义如下所示:

参数解释
-c用于指定 llm API 模式的选项,可以选择 localcloud。默认是 local。如果设置为 -c cloud,则需要先手动将环境变量 {OPENAI_API_KEY, OPENAI_API_BASE, OPENAI_API_MODEL_NAME, OPENAI_API_CONTEXT_LENGTH} 设置到 .env 文件中。
-i用于指定 GPU 设备 ID。
-b用于指定 LLM 推理运行时后端,选项包括 defaulthfvllm
-m用于指定使用 FastChat serve API 加载 LLM 模型的路径,选项包括 Qwen-7B-Chatdeepseek-llm-7b-chat 等。
-t用于指定使用 FastChat serve API 时,根据 LLM 模型的对话模板,选项包括 qwen-7b-chatdeepseek-chat 等。

更加完整的QAnything服务启动命令使用,如下所示:

为了使用更多LLM,需要在/path/to/QAnything/third_party/FastChat/fastchat/conversation.py中配置conv_template。支持使用 FastChat API 与 Huggingface Transformers/vllm 运行时后端的公共大型语言模型(LLM),如下所示:

2.启动成功日志

如果想要查看相关日志,请查看QAnything/logs/目录下的日志文件,如下所示:

序号日志文件解释
1debug.log用户请求处理日志
2sanic_api.log后端服务运行日志
3llm_embed_rerank_tritonserver.log(单卡部署)LLM embedding和rerank tritonserver服务启动日志
4llm_tritonserver.log(多卡部署)LLM tritonserver服务启动日志
5embed_rerank_tritonserver.log(多卡部署或使用openai接口)embedding和rerank tritonserver服务启动日志
6rerank_server.logrerank服务运行日志
7ocr_server.logOCR服务运行日志
8npm_server.log前端服务运行日志
9llm_server_entrypoint.logLLM中转服务运行日志
10fastchat_logs/*.logFastChat服务运行日志
11qa_logs/qa.log问答服务运行日志

3.启动成功容器

容器名称解释
qanything-container-local这是一个运行 qanything 应用的容器。qanything 是一个基于深度学习的对话系统,可以处理各种对话任务。在这个容器中,qanything 应用会根据环境变量的设置,选择本地或云端的模型进行运行。
milvus-standalone-local这是一个运行 milvus 的容器。milvus 是一个开源的向量数据库,用于处理大规模的向量检索和相似性搜索。在这个容器中,milvus 以单机模式运行。
milvus-minio-local这是一个运行 minio 的容器。minio 是一个高性能的开源对象存储服务器,用于存储非结构化的数据,如图片、视频、日志文件等。在这个容器中,minio 用于存储 milvus 的数据。
mysql-container-local这是一个运行 mysql 的容器。mysql 是一个关系型数据库管理系统,用于存储结构化的数据。在这个容器中,mysql 用于存储应用的数据。
milvus-etcd-local这是一个运行 etcd 的容器。etcd 是一个开源的分布式键值存储系统,用于共享配置和服务发现。在这个容器中,etcd 用于存储 milvus 的配置信息。

二.前端启动

1.npm命令启动

前端启动命令分别为npm installnpm run dev,如下所示:

2.启动成功界面

3.新建知识库

新建知识库后,上传文件,就可以和知识库进行对话了,如下所示:

三.部署问题

1.CUDA驱动版本更新

在部署QAnything过程中遇到的最大问题是NVIDIA Driver问题,但是没在意这个问题,后面部署失败,升级后基本就成功了。

ERROR: This container was built for NVIDIA Driver Release 530.30 or later, but version 522.06 was detected and compatibility mode is UNAVAILABLE.

2.通过GeForce Experience升级驱动

通过GeForce Experience升级驱动为最新版本,如下所示:

说明:驱动升级完毕后,重启电脑,然后重新运行run.sh命令。

参考文献

[1] QAnything GitHub:https://github.com/netease-youdao/QAnything

[2] QAnything HuggingFace:https://huggingface.co/netease-youdao/QAnything

[3] Ant Design Vue:https://www.antdv.com/components/overview-cn/

[4] Node.js下载地址:https://nodejs.org/dist/v18.16.0/

[5]前端开发文档:https://github.com/ai408/QAnything/blob/master/front_end/README.md

[6] QAnything接口文档:https://github.com/netease-youdao/QAnything/blob/master/docs/API.md

[7] QAnything中文介绍:https://github.com/netease-youdao/QAnything/blob/master/README_zh.md

[8] 有道智云AI开放平台:https://ai.youdao.com/DOCSIRMA/html/aigc/api/qanything/index.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/366869.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

2024年教育政策与实践研讨会(ICEPP 2024)

随着全球化的不断深入,教育作为国家发展的基石,其政策与实践的探讨愈发显得重要。为此,备受瞩目的教育政策与实践研讨会(ICEPP 2024)将于2024年11月8日至10日在中国武汉隆重举行。此次会议汇聚了国内外众多专家学者&am…

浅谈k8s中cni0和docker0的关系和区别

最近在复习k8s网络方面的知识,查看之前学习时整理的笔记和文档还有过往自己总结的博客之后发现一个问题,就是在有关flannel和calico这两个k8s网络插件的文章和博客中,会涉及到cni0和docker0这两个网桥设备,但是都没有明确说明他们…

AI教育行业全景图(最新版);AI时代内容创作者的窘境;2年内AI教育赛道的切入机会;可汗学院创始人「AI教育革命」新书问世 | ShowMeAI日报

👀日报&周刊合集 | 🎡生产力工具与行业应用大全 | 🧡 点赞关注评论拜托啦! 1. 可汗学院 (Khan Academy) 创始人新书发布:AI将如何颠覆传统教育 可汗学院(Khan Academy)是 Salman Khan 创立的…

LabVIEW项目外协时选择公司与个人兼职的比较

​在选择LabVIEW项目外协合作伙伴时,外协公司和个人兼职各有优劣。个人兼职成本较低且灵活,但在可靠性、技术覆盖面、资源和风险管理上存在不足。而外协公司拥有专业团队、丰富资源、完善的项目管理和风险控制,尽管成本较高,但能提…

分享一款Type C接口USB转2路485模块【带完整原理图】

大家好,我是『芯知识学堂』的SingleYork,今天给大家分享一款很实用的工具–基于Type C接口的USB转2路485模块。 这款模块主芯片采用南京沁恒的CH342F这款芯片,芯片特性如下: 该系列芯片有QFN24和ESSOP10 这2种封装,…

leetcode-20-回溯-切割、子集

一、[131]分割回文串 给定一个字符串 s,将 s 分割成一些子串,使每个子串都是回文串。 返回 s 所有可能的分割方案。 示例: 输入: "aab" 输出: [ ["aa","b"], ["a","a","b"] ] 分析&…

Steam页面打不开?steam显示当前游戏不可用是怎么回事

Steam是全球最大的游戏综合发行平台,每年为无数玩家呈现了多款精彩游戏,不过由于网络问题或其他异常因素影响,有很多玩家会在访问steam或steam的游戏商品页时,遇到Steam提示当前游戏在您平台不可用、打不开游戏页面的情况&#xf…

PCL 点云最小图割(前景、背景点云提取)

点云最小图割 一、概述1.1 概念1.2 算法原理二、代码示例三、运行结果🙋 结果预览 一、概述 1.1 概念 最小图割算法(pcl::MinCutSegmentation):是一种基于图论的对象分割方法,主要用于点云数据的处理和分析。该算法将点云数据表示为一个图结构,其中点云中的点作为图的节…

自然语言处理——英文文本预处理

高质量数据的重要性 数据的质量直接影响模型的性能和准确性。高质量的数据可以显著提升模型的学习效果,帮助模型更准确地识别模式、进行预测和决策。具体原因包括以下几点: 噪音减少:高质量的数据经过清理,减少了无关或错误信息…

【揭秘】国内十大顶尖AI大模型,引领智能科技新纪元

大模型大模型通常指的是参数量非常大、数据量也非常大的深度学习模型。这些模型由数百万到数十亿甚至更多的参数组成,需要海量的数据和强大的计算资源进行训练和推理学习的模型。大模型设计的目的在于提高模型的表示能力和性能、应对复杂数据集和任务、提升泛化能力…

家政小程序的开发,带动市场快速发展,提高家政服务质量

当下生活水平逐渐提高,也增加了年轻人的工作压力,同时老龄化也在日益增加,使得大众对家政的需求日益提高,能力、服务质量高的家政人员能够有效提高大众的生活幸福指数。 但是,传统的家政服务模式存在着效率低、用户与…

Qt的学习之路

目录 一、信号槽机制 1.1 基本概念 1.2 特点 1.3 使用方法 1.4 信号槽连接类型 1.5 注意 二、元对象系统 2.1 基本概念 2.2 实现方式 2.3 主要特性 2.4 使用场景 2.5 元对象系统如何识别信号槽 三、国际化 3.1 标记可翻译的文本(tr函数) …

FPGA - DFT(离散傅里叶变换)—FFT(快速傅里叶变化)

一,DFT(离散傅里叶变换原理) 1,DFT(离散傅里叶变换原理)理论简介 在数字信号处理中有一个基本概念: 如果信号在频域是离散的,则该信号在时域就表现为周期性的时间函数;相反,如果信号在时域是离散的&#x…

VMware ESXi 8.0U3 macOS Unlocker OEM BIOS 集成驱动版,新增 12 款 I219 网卡驱动

VMware ESXi 8.0U3 macOS Unlocker & OEM BIOS 集成驱动版,新增 12 款 I219 网卡驱动 比如联想 ThinkStation P3 Tower 板载 Intel Ethernet Connection (22) I219-LM 0x8086 0x0dc7 已受此版本支持。 VMware ESXi 8.0U3 macOS Unlocker & OEM BIOS 集成网…

【ONLYOFFICE】| 桌面编辑器从0-1使用初体验

目录 一. 🦁 写在前面二. 🦁 在线使用感受2.1 创建 ONLYOFFICE 账号2.2 编辑pdf文档2.3 pdf直接创建表格 三. 🦁 写在最后 一. 🦁 写在前面 所谓桌面编辑器就是一种用于编辑文本、图像、视频等多种自媒体的软件工具,具…

llm学习-2(使用embedding和数据处理)

首先可以简单了解一下向量数据库相关知识: 向量数据库相关知识(搬运学习,建议还是看原文,这个只是我自己的学习记录)-CSDN博客 补充: 使用embedding API 文心千帆API Embedding-V1是基于百度文心大模型…

【论文阅读】transformer及其变体

写在前面: transformer模型已经是老生常谈的一个东西,以transformer为基础出现了很多变体和文章,Informer、autoformer、itransformer等等都是顶刊顶会。一提到transformer自然就是注意力机制,变体更是数不胜数,一提到…

huggingface 笔记:peft

1 介绍 PEFT 提供了参数高效的方法来微调大型预训练模型。传统的范式是为每个下游任务微调模型的所有参数,但由于当前模型的参数数量巨大,这变得极其昂贵且不切实际。相反,训练较少数量的提示参数或使用诸如低秩适应 (LoRA) 的重新参数化方法…

和小红书一起参会! 了解大模型与大数据融合的技术趋势

在过去的两年中,“大模型”无疑成为互联网行业的焦点话题,曾经炙手可热的大数据架构似乎淡出公众视野。然而,大数据领域并未停滞不前,反而快速演进,传统依赖众多开源组件的大数据平台正逐步过渡到以融合与简化为核心特…

【漏洞复现】电信网关配置管理系统——命令执行

声明:本文档或演示材料仅供教育和教学目的使用,任何个人或组织使用本文档中的信息进行非法活动,均与本文档的作者或发布者无关。 文章目录 漏洞描述漏洞复现测试工具 漏洞描述 电信网关配置管理系统是一个用于管理和配置电信网关设备的软件系…