【实战AI】利用deepseek 在mac本地部署搭建个人知识库

【实战AI】利用deepseek 在mac本地部署搭建个人知识库

news/2025/3/21 13:06:46/文章来源:https://blog.csdn.net/zy_jun/article/details/145558347

之前的文章中实现了本地通过ollma 部署deepseek R1：14b 模型，这里我想继续实现个人知识库，方便自己文档，数据的检索；

下载anythingLLM

地址：

https://anythingllm.com/desktop

下载安装即可；

下载嵌入文本处理程序nomic-embed-text

nomic-embed-text

本地终端执行

下载成功

配置

1.打开之前下载的anythingLLM，左下角点击设置，选择llm首选项

2.选择ollama 以及之前安装的本地模型deepseek-r1:14b，如果没有，看这篇文章【实战AI】macbook M1 本地ollama运行deepseek-CSDN博客

3.继续配向量数据库，默认即可

4.嵌入首选项

继续选择ollama ，模型选择nomic-embed-text

记得点击保存修改；

到此，基本配置完成，然后返回首页，点击新建工作区就可以聊天了；

本地知识库配置

但是，我们的重点是搭建个人RAG-本地知识库，不单单是模型交互的，需要将我们自己的数据上传，通过文件处理模型nomic-embed-text，将我们那自己的资料转换到向量数据库，然后我们每次提问，模型会进行前期检索，将从向量数据库中检索到时知识与模型结果整合，返回给我们；

因此，我们需要将自己的资料文档上传，如下图：

上传自己的资料文档；

这里我预先写了一个文档newfile.txt，用来测试效果；内容如下：

然后点击选中上传的文件；点击移动到工作区；

效果如下；

就这样将你想关联的文档资料上传到工作区，最后点保存插入到向量库即可

效果测试

我在没有上传相关资料前提问一个关于东方鲤鱼的问题；

上传资料后，再次提问相同问题；

基本实现本地知识库效果，不足的地方，希望留言交流，谢谢！！！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/18117.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

报名丨Computer useVoice Agent ：使用 TEN 搭建你的 Mac Assistant

报名丨Computer useVoice Agent ：使用 TEN 搭建你的 Mac Assistant

与 TEN 相聚在「LET’S VISION 2025」大会，欢迎来展位上跟我们交流。这次我们还准备了一场聚焦「computer use」的工作坊，功能新鲜上线，线下首波体验！ 📅 TEN 展位：2025年3月1日-2日 TEN workshop&#x…

阅读更多...

日常故障排查 - Linux常用命令

日常故障排查 - Linux常用命令

系统负载相关 top命令使用top命令可以查看正在运行的系统中的动态实时视图信息，显示系统摘要信息，以及Linux内核当前正在管理的任务列表。其支持静态输出，也支持交互式输出，还可以在启动之前读取响应的配置文件来决定如何显示进…

阅读更多...

C++算法竞赛基础语法-9

C++算法竞赛基础语法-9

快速排序是一种高效的排序算法，由C. A. R. Hoare在1960年提出，基本思想是分治法（Divide and Conquer）策略，通过递归将一个大问题分解为若干个较小的子问题，然后合并这些子问题的解来解决原始问题快速排序…

阅读更多...

如何在 Elasticsearch 中设置向量搜索 - 第二部分

如何在 Elasticsearch 中设置向量搜索 - 第二部分

作者：来自 Elastic Valentin Crettaz 了解如何在 Elasticsearch 中设置向量搜索并执行 k-NN 搜索。本文是三篇系列文章中的第二篇，深入探讨了向量搜索（也称为语义搜索）的复杂性以及它在 Elasticsearch 中的实现方式。第一部分重…

阅读更多...

【算法专场】哈希表

【算法专场】哈希表

目录前言哈希表 1. 两数之和 - 力扣（LeetCode） 算法分析算法代码面试题 01.02. 判定是否互为字符重排编辑算法分析算法代码 217. 存在重复元素算法分析算法代码 219. 存在重复元素 II 算法分析算法代码解法二算法代码算法…

阅读更多...

cpu温度多少正常？cpu温度过高怎么办

cpu温度多少正常？cpu温度过高怎么办

CPU温度是指中央处理器的工作温度，它是影响电脑性能和稳定性的重要因素。如果CPU温度过高，会导致电脑卡顿、死机、自动关机、甚至损坏CPU。因此，了解CPU温度的正常范围和降温的方法，对于保护电脑和提高效率是非常有必要的。一、C…

阅读更多...

Git指南-从入门到精通

Git指南-从入门到精通

代码提交和同步命令流程图如下： 第零步: 工作区与仓库保持一致第一步: 文件增删改，变为已修改状态第二步: git add ，变为已暂存状态 bash $ git status $ git add --all # 当前项目下的所有更改 $ git add . # 当前目录下的所有更改 $ g…

阅读更多...

盛铂科技 SCP4006/4018/4040：国产袖珍式功率计射频微波功率探头平均功率计

在通信、电子测量等领域，功率计是确保信号稳定、系统高效运行的关键设备。盛铂科技自主研发的 SCP4000 系列自带 USB 接口的袖珍式 CW 信号平均功率计，以其卓越的性能、高性价比和便捷的操作，在众多同类产品中脱颖而出，成为行业内…

阅读更多...

IntelliJ IDEA 2024.1.4版无Tomcat配置

IntelliJ IDEA 2024.1.4版无Tomcat配置

IntelliJ IDEA 2024.1.4 (Ultimate Edition) 安装完成后，调试项目发现找不到Tomcat服务： 按照常规操作添加，发现服务插件中没有Tomcat。。。解决方法 1、找到IDE设置窗口 2、点击Plugins按钮，进入插件窗口，搜索T…

阅读更多...

【个人开发】deepseed+Llama-factory 本地数据多卡Lora微调

【个人开发】deepseed+Llama-factory 本地数据多卡Lora微调

文章目录 1.背景2.微调方式2.1 关键环境版本信息2.2 步骤2.2.1 下载llama-factory2.2.2 准备数据集2.2.3 微调模式2.2.4 微调脚本 2.3 踩坑经验2.3.1 问题一：ValueError: Undefined dataset xxxx in dataset_info.json.2.3.2 问题二： ValueError: Target…

阅读更多...

SEO短视频矩阵系统源码开发概述

SEO短视频矩阵系统源码开发概述

一、功能特性多账号、多平台一键授权管理：该系统支持抖音、快手、小红书、B站和视频号等平台的账户集成，实现统一管理。批量视频发布及定时发布功能：用户能够通过系统进行大规模视频的批量上传和设定具体发布时间。AI混剪技术生成原创内容&…

阅读更多...

Linux 服务器部署deepseek

Linux 服务器部署deepseek

把手教你在linux服务器部署deepseek，打造专属自己的数据库知识库正文开始第一步：安装Ollama 打开官方网址：https://ollama.com/download/linux 下载Ollama linux版本复制命令到linux操作系统执行 [rootpostgresql ~]# curl -fsSL http…

阅读更多...

DeepSeek-VL2 环境配置与使用指南

DeepSeek-VL2 环境配置与使用指南

DeepSeek-VL2 环境配置与使用指南 DeepSeek-VL2 是由 DeepSeek 公司开发的一种高性能视觉-语言模型（VLM）。它是 DeepSeek 系列多模态模型中的一个版本，专注于提升图像和文本之间的交互能力。本文将详细介绍如何配置 DeepSeek-VL2 的运行环…

阅读更多...

EasyRTC轻量级SDK：智能硬件音视频通信资源的高效利用方案

EasyRTC轻量级SDK：智能硬件音视频通信资源的高效利用方案

在智能硬件这片广袤天地里，每一份资源的精打细算都关乎产品的生死存亡。随着物联网技术的疾速演进，实时音视频通信功能已成为众多设备的标配。然而，硬件资源的捉襟见肘，让开发者们常常陷入两难境地。EasyRTC，以它的极致…

阅读更多...

Github Action自动流翻译README文档【CI/CD】

Github Action自动流翻译README文档【CI/CD】

翻译自述文件操作一、自述文件翻译英语简体中文繁体中文印地语法语阿拉伯 GitHub Action 将自述文件翻译成任何语言这是一个 GitHub Action，可以自动将你的 repo 中的自述文件翻译成指定的语言。二、设置添加工作流文件到您的项目（例如.githu…

阅读更多...

张弛语言课退费动漫配音与人物的深度剖析退费

张弛语言课退费动漫配音与人物的深度剖析退费

在动漫的奇幻世界里，精彩的画面固然吸睛，而配音更是赋予角色灵魂的关键要素，它与人物之间存在着千丝万缕的紧密联系。《火影忍者》中的鸣人，他的配音充满活力与朝气，声音高亢且坚定，将鸣人的热血、乐观和…

阅读更多...

Nginx负载均衡

Nginx负载均衡

一。Nginx负载均衡的算法以及过程二。nginx四层负载均衡的配置（四层） 1.vi /etc/nginx/conf.d/lb.conf 比较常见：weight：设置权重，backup：当其他主机全部用不了，这个作为备份 2.systemctl r…

阅读更多...

Python爬虫实战：股票分时数据抓取与存储 (1)

Python爬虫实战：股票分时数据抓取与存储 (1)

在金融数据分析中，股票分时数据是投资者和分析师的重要资源。它能够帮助我们了解股票在交易日内的价格波动情况，从而为交易决策提供依据。然而，获取这些数据往往需要借助专业的金融数据平台，其成本较高。幸运的是，通过…

阅读更多...

json-schema 的编辑器

json-schema 的编辑器

最近在找一个 json-schema 的编辑器，在网上找了找，以下两个项目用的比较多一、两款json-schema-editor 1、vue-json-schema-editor-visual 一个高效易用的基于 Vue Element UI 的 json-schema 编辑器。 git地址：https://github.com/gis…

阅读更多...

记一次Self XSS+CSRF组合利用

记一次Self XSS+CSRF组合利用

视频教程在我主页简介或专栏里 （不懂都可以来问我专栏找我哦） 目录：　确认 XSS 漏洞确认 CSRF 漏洞这个漏洞是我在应用程序的订阅表单中发现的一个 XSS 漏洞，只能通过 POST 请求进行利用。通常情况下，基于 POST 的…

阅读更多...

最新文章

推荐文章