构建私有化AI知识库:基于CentOS的Ollama + DeepSeek-R1 +ragflow 整合部署教程

  • 操作系统:CentOS 7.9

  • CPU:支持 AVX 指令集的 x86_64 处理器

  • 内存:64GB

  • 存储:SSD 1TB 以上

  • GPU(可选)

一、组件介绍

Ollama

Ollama 是一个专为在本地机器上部署和运行大型语言模型(LLM)而设计的开源框架。它提供了一种便捷的方式来加载、运行和管理不同的自然语言处理(NLP)模型。主要特性包括:

支持多种 AI 模型:可运行 LLaMA、DeepSeek、Mistral 等不同的 LLM。

本地推理:支持离线运行,适用于私有化部署。

轻量级管理:提供简单的 CLI 命令,无需复杂配置。

DeepSeek-R1

DeepSeek-R1 是一种语义搜索模型,专注于通过深度学习算法对文本和数据进行语义理解和匹配。主要特点包括:

语义检索能力:在海量文档或数据集中进行高效搜索,超越传统关键词匹配。

对标 OpenAI o1:提供全面、详实的回答,能够生成结构化的输出。

适用于知识库增强(RAG):可结合 LLM 提升问答系统的准确性。

Ragflow

Ragflow 是一个 RAG(Retrieval-Augmented Generation)框架,旨在提升 AI 知识库的检索能力和生成效果。其核心功能包括:

文档索引与向量化:基于 DeepSeek-R1 进行高效检索。

检索增强生成(RAG):结合 Ollama 提供基于上下文的智能回答。

可扩展性强:支持本地或云端部署。

二、Ollama 安装与配置

# 下载并安装 Ollama  Ollama 的安装脚本默认从国外服务器下载,国内访问较慢。可以使用代理或者手动下载。#下载ollama_install.sh并保存
curl -fsSL https://ollama.com/install.sh -o ollama_install.sh#使用github文件加速替换github下载地址
sed -i 's|https://ollama.com/download/ollama-linux|https://gh.llkk.cc/https://github.com/ollama/ollama/releases/download/v0.5.7/ollama-linux|g' ollama_install.sh#增加可执行权限
chmod +x ollama_install.sh#执行sh
sh ollama_install.sh

2.1 ollama常用命令
# 下载(拉取)指定 AI 模型
ollama pull <model-name>  # 例如 ollama pull deepseek-r1# 运行指定 AI 模型并进行对话
ollama run <model-name>  # 例如 ollama run deepseek-r1# 交互式对话模式
ollama chat <model-name># 列出本地可用模型
ollama list# 删除本地模型
ollama rm <model-name># 创建或修改自定义模型
ollama create <model-name> -f <modelfile># 停止所有运行中的 Ollama 服务
ollama stop# 启动 Ollama 后台服务(通常会自动运行)
ollama serve

三、部署Ragflow 进行 RAG 整合

3.1 需要安装git和docker-compose(建议v2.29版本及以上)
# 安装 Docker Compose(用于管理 Ragflow 相关服务)
wget https://github.com/docker/compose/releases/download/v2.29.0/docker-compose-linux-x86_64# 移动 Docker Compose 到系统目录
mv docker-compose-linux-x86_64 /usr/local/bin/docker-compose# 赋予执行权限
chmod +x /usr/local/bin/docker-compose# 验证安装是否成功
docker-compose --version# 克隆 Ragflow 代码仓库
git clone https://github.com/ragflow/ragflow.git# 进入 Ragflow Docker 目录
cd ragflow/docker# 赋予启动脚本可执行权限
chmod +x ./entrypoint.sh# 通过 Docker Compose 启动 Ragflow
# 该命令会在后台运行 Ragflow 相关服务
docker-compose -f docker-compose.yml up -d

如果启动报错 Error response from daemon: invalid IP address in add-host: "host-gateway"是由于Docker 版本过旧host-gateway 是 Docker 20.10.0 及以上版本才支持的功能。如果暂时无法升级 Docker,可以 删除 extra_hosts 里的 host-gateway,或者换成:

extra_hosts: - "host.docker.internal:172.17.0.1"

如图 

其中 172.17.0.1 是默认的 Docker 网桥网关(你也可以 ip adocker0 的实际 IP)

修改后成功启动,使用ip+80端口可以访问到主页,注册一个账号然后登录。

四、使用RAGFlow

点击头像可以自定义一写配置,主要是先添加模型;我们是本地化部署了ollama所以选择本地模型,当然如果不想本地部署也可以选择DeepSeek、Tongyi等官方的key,但是这些数据就会发到公网。

 添加chat模型

模型选择chat;

模型名称和ollama list中的chat模型名字一致;

基础url:http://host.docker.internal:11434  (docker访问宿主机要用host.docker.internal,ollama的端口是11434);

最大token 随便填的。 

注意:ollama默认运行在127.0.0.1网段上,在ollama.service文件中添加

vi /etc/systemd/system/ollama.service#在Environment= 后面加入
"OLLAMA_HOST=0.0.0.0:11434"#重启ollama
systemctl daemon-reload
systemctl restart ollama.service

确保Ollama服务监听在本机上的所有网络接口上的指定端口上,从而允许从多个网络位置访问服务。 

添加 Embedding 模型

 

系统模型设置中选择已添加的模型 

 

创建知识库 
 上传之后选择解析方法


1. General(通用解析)
    功能定位  作为基础解析器,处理常规文档(如TXT、PDF、Word、网页等),提取文本内容及基础结构(标题、段落、列表)。
    技术特点
        依赖格式解析库(如PyPDF2、python-docx)提取原始文本。
        可能结合NLP进行基础分句或段落分割,但保留原文整体性。
2. Q&A(问答解析)
    功能定位
    专门处理问答形式的内容,将文档中的问题与答案结构化存储。
    技术特点
        使用规则匹配(如正则表达式)或序列标注模型识别"问题-答案"对。
        可能结合语义相似度模型对相似问题进行聚类。

3. Table(表格解析)
    功能定位
    识别并提取文档中的表格数据,保留行列结构与数据类型。
    技术特点
        对扫描文档使用OCR表格识别(如Tesseract+OpenCV)。
        对电子文档(Excel/Word表格)解析行列元数据。
        可能结合模式匹配修复复杂合并单元格结构。

4. One(单文档解析)
    功能定位
    将整个文档视为不可分割的单一文本单元处理。
    技术特点
        跳过分块或分段,保留完整上下文。
        可能结合长文本编码模型(如BERT的滑动窗口)生成嵌入。
5. Knowledge(知识解析)
    功能定位
    从文本中提取结构化知识(实体、关系、事件),构建知识图谱。
    技术特点
        使用NER模型(如Spacy、BERT-NER)识别实体。
        关系抽取模型(如联合编码模型)建立实体间关联。
        事件抽取技术识别时间、地点、动作等要素。

选择建议
    内容类型:表格数据选Table,问答文档用Q&A,短文本用One。
    任务需求:需实体关系选Knowledge,通用检索用General。
    性能权衡:Knowledge解析计算成本高,General/One更轻量。

注意要开始解析--解析成功

 创建聊天

选择聊天模型 

 

 测试 未完待续。。。。。。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/27604.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Goby 漏洞安全通告| Ollama /api/tags 未授权访问漏洞(CNVD-2025-04094)

漏洞名称&#xff1a;Ollama /api/tags 未授权访问漏洞&#xff08;CNVD-2025-04094&#xff09; English Name&#xff1a;Ollama /api/tags Unauthorized Access Vulnerability (CNVD-2025-04094) CVSS core: 6.5 风险等级&#xff1a; 中风险 漏洞描述&#xff1a; O…

Linux命令超级汇总

文件和目录操作 命令语法常用选项及说明lsls [选项] [目录名]- -l&#xff1a;以长格式显示文件和目录信息 - -a&#xff1a;显示所有文件&#xff0c;包括隐藏文件 - -h&#xff1a;与 -l 配合&#xff0c;以人类可读的方式显示文件大小 - -R&#xff1a;递归显示子目录内容cd…

Python 爬取唐诗宋词三百首

你可以使用 requests 和 BeautifulSoup 来爬取《唐诗三百首》和《宋词三百首》的数据。以下是一个基本的 Python 爬虫示例&#xff0c;它从 中华诗词网 或类似的网站获取数据并保存为 JSON 文件。 import requests from bs4 import BeautifulSoup import json import time# 爬取…

14. LangChain项目实战1——基于公司制度RAG回答机器人

教学视频&#xff1a; 12. 基于Gradio搭建基于公司制度RAG_哔哩哔哩_bilibilihttps://www.bilibili.com/video/BV11VXRYTErZ/ 环境配置&#xff1a; python版本&#xff1a;3.10.8 服务器&#xff1a;Ubuntu 依赖包requirements.txt文件内容&#xff1a; aiofiles23.2.1 …

香港首个人工智能大模型HKGAI V1发布:粤语AI时代正式开启

2月25日&#xff0c;香港科技创新领域迎来了一项里程碑式的成就——由香港特区政府重点创科项目“InnoHK 创新香港研发平台”慷慨资助的香港生成式人工智能研发中心(HKGAI)正式揭晓了其倾力打造的HKGAI V1大模型。这一创举不仅标志着香港在人工智能发展道路上迈出了坚实的一步&…

简易的微信聊天网页版【项目测试报告】

文章目录 一、项目背景二、项目简介登录功能好友列表页面好友会话页面 三、测试工具和环境四、测试计划测试用例部分人工手动测试截图web自动化测试测试用例代码框架配置内容代码文件&#xff08;Utils.py&#xff09;登录页面代码文件&#xff08;WeChatLogin.py&#xff09;好…

QT播放视频保持视频宽高比消除黑边

QT播放视频保持视频宽高比消除黑边 1、问题 在播放视频的时候&#xff0c;由于框架的大小发生变化&#xff0c;导致视频出现黑边很不好看。 因此需要像一种方法消除黑边 2、处理 1、读取视频的宽高比 2、设置视频的Widget的大小固定&#xff0c;Widget的宽高比和视频宽高比…

Apache nifi demo 实验

Apache nifi 是个数据流系统&#xff0c;可以通过配置 自定义的流程来实现数据的转换。 比如可以配置一个流程&#xff0c;读取数据库里的数据&#xff0c;再转换&#xff0c;最后保存到本地文件。 这样可以来实现一些数据转换的操作&#xff0c;而不用特地编写程序来导入导出。…

蓝桥杯 - 每日打卡(类斐波那契循环数)

题目: 解题思路&#xff1a; 假设输入数值为number 分析题目&#xff0c;如果想要解决这个问题&#xff0c;我们需要实现两个方法&#xff0c;第一个检查number是否是类斐波那契&#xff0c;第二个是模拟1e7 - 0的过程&#xff0c;因为是求最大的&#xff0c;那么我们从1e7开始…

DeepSeek集成到VScode工具,让编程更高效

DeepSeek与VScode的强强联合&#xff0c;为编程效率树立了新标杆。 DeepSeek&#xff0c;一款卓越的代码搜索引擎&#xff0c;以其精准的索引和高速的检索能力&#xff0c;助力开发者在浩瀚的代码海洋中迅速定位关键信息。 集成至VScode后&#xff0c;开发者无需离开熟悉的编辑…

RAG组件:向量数据库(Milvus)

在当前大模型盛行的时代&#xff0c;大模型的垂类微调、优化成为产业落地、行业应用的关键&#xff1b;RAG技术应运而生&#xff0c;主要解决大模型对专业知识、实效性知识欠缺的问题&#xff1b; RAG的核心工作逻辑是将专业知识、实效知识等大模型欠缺的知识进行收集、打包、保…

2022java面试总结,1000道(集合+JVM+并发编程+Spring+Mybatis)的Java高频面试题

1、面试题模块汇总 面试题包括以下十九个模块&#xff1a; Java 基础、容器、多线程、反射、对象拷贝、Java Web 模块、异常、网络、设计模式、Spring/Spring MVC、Spring Boot/Spring Cloud、Hibernate、Mybatis、RabbitMQ、Kafka、Zookeeper、MySql、Redis、JVM 。如下图所示…

英码科技携昇腾DeepSeek大模型一体机亮相第三届北京人工智能产业创新发展大会

2025年2月28日&#xff0c;第三届北京人工智能产业创新发展大会在国家会议中心隆重开幕。本届大会以"好用、易用、愿用——以突破性创新加速AI赋能千行百业”为主题&#xff0c;重点展示人工智能技术创新成果与产业化应用实践。作为昇腾生态的APN伙伴&#xff0c;英码科技…

(链表 删除链表的倒数第N个结点)leetcode 19

设空结点指向head便于插入和删除结点 考虑特殊情况 head结点被删除 a结点仅用来测试长度&#xff0c;找到目标结点的位置 b结点为空结点指向head返回值 cur用来删除目标值&#xff08;特殊情况 目标值为head 这时curb) 则开始就将cur初始化为b开始遍历 /*** Definition fo…

Android Studio 新版本Gradle发布本地Maven仓库示例

发布代码到JitPack示例&#xff1a;https://blog.csdn.net/loutengyuan/article/details/145938967 以下是基于 Android Studio 24.2.2&#xff08;Gradle 8.10.2 AGP 8.8.0 JDK17&#xff09; 的本地 Maven 仓库发布示例&#xff0c;包含aar和jar的不同配置&#xff1a; 1.…

[今年毕业设计]最新最全最有创意的基于云计算的计算机专业毕设选题精选推荐汇总建议收藏!!

文章目录 前言基于云计算的毕业设计选题毕设作品展示 前言 2025全新毕业设计项目 &#x1f497;博主介绍&#xff1a;✌全网粉丝10W,CSDN全栈领域优质创作者&#xff0c;博客之星、掘金/华为云/阿里云等平台优质作者。 &#x1f447;&#x1f3fb; 精彩专栏 推荐订阅&#x1f4…

coze生成的工作流,发布后,利用cmd命令行执行。可以定时发日报,周报等。让他总结你飞书里面的表格。都可以

coze生成的工作流&#xff0c;发布后&#xff0c;利用cmd命令行执行。可以定时发日报&#xff0c;周报等。让他总结你飞书里面的表格。都可以。 很简单。 准备工作&#xff0c;先发布你的工作流&#xff0c;和发布应用。 然后&#xff0c;点击扣子API 。 申请一个&#xff0…

安防监控/视频集中存储EasyCVR视频汇聚平台如何配置AI智能分析平台的接入?

EasyCVR安防视频监控平台不仅支持AI边缘计算智能硬件设备的接入&#xff0c;还能快速集成AI智能分析平台&#xff0c;接收来自智能分析平台或设备的AI告警信息&#xff0c;如烟火检测、周界入侵检测、危险区域闯入检测、安全帽/反光衣佩戴检测等。 本文将详细介绍如何在EasyCVR…

以1.7K深圳小区房价为例,浙大GIS实验室使用注意力机制挖掘地理情景特征,提升空间非平稳回归精度

地理加权回归 (Geographically Weighted Regression, GWR) 是一种广泛应用于地理空间分析的统计方法&#xff0c;用于捕捉地理现象的空间非平稳性&#xff08;即空间异质性&#xff09;。传统 GWR 通过为每个观测点分配权重来反映其对回归参数的影响&#xff0c;这些权重通常基…

【JavaEE】线程安全

【JavaEE】线程安全 一、引出线程安全二、引发线程安全的原因三、解决线程安全问题3.1 synchronized关键字&#xff08;解决修改操作不是原子的&#xff09;3.1.1 synchronized的特性3.1.1 synchronized的使用事例 3.2 volatile 关键字&#xff08;解决内存可见性&#xff09; …