大模型本地部署及本地知识库构建

大模型本地部署及本地知识库构建

news/2025/3/29 1:53:31/文章来源:https://blog.csdn.net/qq_22253209/article/details/145777580

1、引言

随着AI技术的快速发展和普及，越来越多的LLM开始开源，若想在本地尝试部署大模型和搭建知识库，可以使用ollama+LLMs+cherry Studio+ nomic-embed-text的框架来实现，以便于对AI简单应用流程的整体了解。本地部署和知识库的搭建本身不难，按部就班就可以。

2、组件介绍

ollama：Ollama是一个在本地运行的大预言模型的的工具，可以再不同的操作系统商安装。可以认为ollama就是一个LLM的容器管理工具，和Docker有点类似。

LLMs：大语言模型模型很多，像现在比较火的、开源的deepSeek R1模型等，由于在本地电脑上不是我们可以选择14b以下的版本。

cherry Studio：Cherry Studio AI 是一款强大的多模型 AI 助手,支持 iOS、macOS 和 Windows 平台。快速切换多个先进的 LLM 模型,提升工作学习效率。支持多个第三方模型的调用。

nomic-embed-text：一个高性能的开放嵌入模型。

3、部署

3.1 ollama安装

在ollam官网上下载:ollama下载地址

exe程序一步一步安装，可以使用默认配置，比较简单。

3.2下载LLM

例如下载阿里千问的模型，输入命令：

ollama run qwen2.5

或者

ollama run deepseek-r1:1.5b

相关的模型可以再ollam官网上查找：

3.3 文本嵌入安装

文本嵌入模型主要是为了构建知识库，在命令行中输入：

ollama pull nomic-embed-text: latest

3.4 cherry Studio配置

（1）首先，从逛网上下载cherry Studio，Cherry Studio - 全能的AI助手

（2）exe文件逐步安装，比较简单；

（3）打开cherry Studio进行配置：

在设置中：选择Ollama，设置API地址，ollama的默认端口是11434，一般不用修改；

点击“管理按钮”，添加模型，前面下载的模型会在列表中展示出来。

在chat界面，就可以和大模型聊天了

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/21808.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

在 Ansys Motion 中创建链式伸缩臂的分步指南

在 Ansys Motion 中创建链式伸缩臂的分步指南

介绍链传动在负载和/或运动要远距离传递的机器中非常多产，例如，在两个平行轴之间。链条驱动系统的设计需要了解载荷传递和运动学如何影响链条张力、轴轴承中的悬臂载荷、轴应力和运动质量等。使用 Ansys Motion，可以轻松回答上述所有问题以…

阅读更多...

blender笔记2

blender笔记2

一、物体贴地物体->变换->对齐物体 ->对齐弹窗(对齐模式：反方，相对于：场景原点，对齐：z)。之后可以设置原点->原点--3d游标二、面上有阴影在编辑模式下操作过后，物体面有阴影。数据-&g…

阅读更多...

SPRING10_SPRING的生命周期流程图

SPRING10_SPRING的生命周期流程图

经过前面使用三大后置处理器BeanPostProcessor、BeanFactoryPostProcessor、InitializingBean对创建Bean流程中的干扰,梳理出SPRING的生命周期流程图如下

阅读更多...

光子集成电路加速边缘AI推理：突破传统NPU的能效比极限

光子集成电路加速边缘AI推理：突破传统NPU的能效比极限

引言：边缘计算的能耗困局某领先自动驾驶公司采用128核光子张量处理器后，激光雷达点云处理能效比达458TOPS/W，是传统车规级GPU方案的57倍。在16线束LiDAR实时语义分割任务中，光子矩阵乘法单元将特征提取延迟从8.3ms降至0.12ms&am…

阅读更多...

【EndNote】WPS 导入EndNote 21

【EndNote】WPS 导入EndNote 21

写在前面：有没有人有激活码，跪求！ EndNote，在文献管理和文献引用方面很好用。写文章的时候，使用EndNote引入需要的文献会很方便。我目前用的WPS，想把EndNote的CWYW（Cite While You Write&#…

阅读更多...

2025.2.23机器学习笔记：PINN文献阅读

2025.2.23机器学习笔记：PINN文献阅读

2025.2.23周报一、文献阅读题目信息摘要Abstract创新点网络架构架构A架构B架构C 实验结论后续展望一、文献阅读题目信息题目： Physics-Informed Neural Networks for Modeling Water Flows in a River Channel期刊： IEEE TRANSACTIONS ON ARTIFICI…

阅读更多...

SpringBoot 配置文件

SpringBoot 配置文件

介绍配置文件时用来解决硬编码问题，把可能会发生改变的信息放在一个集中的地方也就说配置文件上，当我们启动某个程序的时候，应用程序会从配置文件中读取数据，并加载运行。硬编码是指将数据直接嵌入到源代码中，也就…

阅读更多...

Redis三剑客解决方案

Redis三剑客解决方案

文章目录缓存穿透缓存穿透的概念两种解决方案: 缓存雪崩缓存击穿缓存穿透缓存穿透的概念每一次查询的 key 都不在 redis 中，数据库中也没有。一般都是属于非法的请求，比如 id<0，比如可以在 API 入口做一些参数校验。大量访问不存…

阅读更多...

LeeCode题库第二十八题

LeeCode题库第二十八题

28.找出字符串第一个匹配项的下标项目场景： 给你两个字符串 haystack 和 needle ，请你在 haystack 字符串中找出 needle 字符串的第一个匹配项的下标（下标从 0 开始）。如果 needle 不是 haystack 的一部分，则返回 …

阅读更多...

亚马逊AI图像模型Nova深度体验（含源代码）（上）

亚马逊AI图像模型Nova深度体验（含源代码）（上）

在本系列的上篇中，我们介绍了如何利用Amazon Nova Canvas进行创意图片内容生成，并使用Amazon Bedrock的InvokeModel API进行文本到图像（文生图）的生成。并且介绍了Nova Canvas提供的广泛的功能，包括图像修复、画布扩展…

阅读更多...

【MySQL】第八弹---全面解析数据库表的增删改查操作：从创建到检索、排序与分页

【MySQL】第八弹---全面解析数据库表的增删改查操作：从创建到检索、排序与分页

✨个人主页： 熬夜学编程的小林 💗系列专栏： 【C语言详解】【数据结构详解】【C详解】【Linux系统编程】【MySQL】目录 1 表的增删改查 1.1 Create 1.1.1 单行数据全列插入 1.1.2 多行数据指定列插入 1.1.3 插入否则更新 1.1.4 替…

阅读更多...

标量化rknn的输入输出向量转换处理

标量化rknn的输入输出向量转换处理

这是一篇技术探索。yolo11模型生成后，我发现它无法在rknn环境正确识别出目标对象。而在宿主机上，或者直接调用.pt转换过的.onnx模型是可以得到正确结果的。这篇文章对应近乎一天的工作。最终的结论就是。这是一个模型量化的问题，与yolo的版本…

阅读更多...

边缘安全加速（Edge Security Acceleration）

边缘安全加速（Edge Security Acceleration）

边缘安全加速（Edge Security Acceleration，简称ESA）是一种通过将安全功能与网络边缘紧密结合来提升安全性和加速网络流量的技术。ESA的目标是将安全措施部署到接近用户或设备的地方，通常是在网络的边缘，而不是将所有流…

阅读更多...

图表控件Aspose.Diagram入门教程：使用 Python 将 VSDX 转换为 PDF

图表控件Aspose.Diagram入门教程：使用 Python 将 VSDX 转换为 PDF

将VSDX转换为PDF可让用户轻松共享图表。PDF 文件保留原始文档的布局和设计。它们广泛用于演示文稿、报告和文档。在这篇博文中，我们将探讨如何在 Python 中将 VSDX 转换为 PDF。本文涵盖以下主题： Python VSDX 到 PDF 转换器库使用 Python 将 VSDX 转…

阅读更多...

两相四线步进电机的步距角为什么是1.8度

两相四线步进电机的步距角为什么是1.8度

机缘在CSDN查了好多文章，发现都是用公式来解释1.8的步距角（Q＝360／MZ），因为转子是50齿，4拍一个循环，所以θ360度/（50x4）1.8度。估计第一次接触步进电机的什么…

阅读更多...

$Helix——Figure 02发布通用人形机器人控制的VLA：一组神经网络权重下的快与慢双系统，让两个机器人协作干活$

Helix——Figure 02发布通用人形机器人控制的VLA：一组神经网络权重下的快与慢双系统，让两个机器人协作干活

前言过去一周，我花了很大的心思、力气，把deepseek的GRPO、MLA算法的代码解析通透，比如GRPO与PPO的详细对比，再比如MLA中，图片公式代码的一一对应 2.20日晚，无意中刷到figure 02发布Helix的一个演示视频…

阅读更多...

Unity游戏制作中的C#基础（2）变量与数据类型

Unity游戏制作中的C#基础（2）变量与数据类型

1.变量 （1）变量的定义：变量是用于存储数据的容器。 （2）变量的作用：在程序运行过程中，我们可以将各种类型的数据存储在变量中，方便后续使用和操作。 （3）变量…

阅读更多...

革新之力：数字科技——重塑未来的超越想象之旅

革新之力：数字科技——重塑未来的超越想象之旅

在21世纪的科技浪潮中，数字科技如同一股不可阻挡的洪流，正以前所未有的速度和广度改变着我们的生活、工作乃至整个社会的结构。它不仅是技术的简单迭代，更是对人类社会认知边界的拓宽，对经济模式、社会治理、文化形态等多方面的深…

阅读更多...

python pandas下载

python pandas下载

pandas pandas:就是一个可以处理数据的 python 库核心功能： 数据的清洗：处理丢失值，重复值数据分析：计算和统计信息，或分组汇总数据可视化：结合图标库（Matplotlib）完成数据可视化…

阅读更多...

将Google文档导入WordPress：简单实用的几种方法

将Google文档导入WordPress：简单实用的几种方法

Google文档是内容创作者非常实用的写作工具。它支持在线编辑、多人协作，并能够自动保存内容。但当我们想把Google文档中的内容导入WordPress网站时，可能会遇到一些小麻烦，比如格式错乱、图片丢失等问题。本文将为大家介绍几种简单实用的方法&…

阅读更多...

最新文章

推荐文章