Ollama拉起本地模型以及rag系统部署。

Ollama拉起本地模型以及rag系统部署。

news/2024/11/23 21:01:45/文章来源:https://blog.csdn.net/u013092227/article/details/141869569

什么是 Ollama ？

Ollama 是一个简明易用的本地大模型运行框架。能在本地启动并运行 Llama、qwen、Gemma 及其他大语言模型，没有GPU资源照样可以拉起模型，和LocalAI 比较类似，但是加载模型更容易。

1.安装

在这里插入图片描述
安装后运行，执行：http://127.0.0.1:11434/，返回：Ollama is running表示成功

2.拉取模型：

在这里插入图片描述

3.运行模型

ollama run qwen2（mac电脑加载的7b），执行后开始提问，如下图：

4.open-webui，更加方便web方式提问。

什么是 Open WebUI ？
Open WebUI 是针对 LLM 的用户友好的 WebUI，支持的 LLM 运行程序包括 Ollama 和 OpenAI 兼容的 API。
Open WebUI 系统旨在简化客户端（您的浏览器）和 Ollama API 之间的交互。此设计的核心是后端反向代理，可增强安全性并解决 CORS 问题。
参考：https://github.com/open-webui/open-webui

docker run -d -p 3000:8080 --add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:main

在这里插入图片描述

搭建简单的tag系统

下载

地址：https://anythingllm.com/

配置

在这里插入图片描述
embed及向量数据库选默认

新建工作区，然后上传文档，然后向量化存储。

基于文档，对话，如下可以看到部分文档被引用到。
在这里插入图片描述

其他

rag系统：fastgpt

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/415902.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

统一NLP和目标检测的DETR（一）——self attention、encoder、decoder

统一NLP和目标检测的DETR（一）——self attention、encoder、decoder

主流目标检测算法劣势 YOLO系列，它基于anchor来做，少不了要用MNS，导致速度相对较慢。但今天介绍一款DETR，基于VIT的目标检测算法。那么我们需要先深入过一遍VIT。 Vision transform 1、传统RNN网络的问题单向：只…

阅读更多...

YOLOv8改进实战 | 引入混合局部通道注意力模块MLCA（2023轻量级）

YOLOv8改进实战 | 引入混合局部通道注意力模块MLCA（2023轻量级）

YOLOv8专栏导航：点击此处跳转前言 YOLOv8 是由 YOLOv5 的发布者 Ultralytics 发布的最新版本的 YOLO。它可用于对象检测、分割、分类任务以及大型数据集的学习，并且可以在包括 CPU 和 GPU 在内的各种硬件上执行。 YOLOv8 是一种尖端的、最先进的 (SOTA) 模型，它建立在以前…

阅读更多...

C++和Python混合编程——Python调用C++入门

C++和Python混合编程——Python调用C++入门

大纲背景代码入门环境准备头文件业务代码注册BOOST_PYTHON_MODULE作用 boost::python::class_模板类编译运行项目地址背景 Python语言在大数据、人工智能以及大模型开发中扮演着举足轻重的角色，其影响力不断扩大并深化。在大数据领域，Python以其简…

阅读更多...

unittest | 使用unittest模块来测试logging日志模块功能

unittest | 使用unittest模块来测试logging日志模块功能

我们在这篇文章实现了在项目工程中编写一个logging模块，但是我们如何确定我们编写的模块功能的是否正常? 你可能想到将全部代码写完后运行测试，但这是一个非常不好的习惯。❌ 最好的方式，是每写出来一个功能或者方法就对它进行测试&#x…

阅读更多...

Java设计模式之装饰器模式详细讲解和案例示范

Java设计模式之装饰器模式详细讲解和案例示范

1. 引言装饰器模式（Decorator Pattern）是一种结构型设计模式，它允许向现有对象添加新的功能，而无需修改其结构。这种模式通过使用组合而非继承来扩展对象的行为，在许多实际应用中极为常见。本文将详细介绍装饰器模式…

阅读更多...

使用 docker 部署 kvm 图形化管理工具 WebVirtMgr

使用 docker 部署 kvm 图形化管理工具 WebVirtMgr

文章目录 [toc]前提条件镜像构建启动 webvirtmgr创建其他 superuser配置 nginx 反向代理和域名访问绑定 kvm 宿主机local sockettcp 连接虚拟机创建创建快照虚拟机克隆删除虚拟机 kvm 官方提供了以下这些图形化管理，license 这块也提示了是商业版（Comme…

阅读更多...

Android实习面经整理第一篇

Android实习面经整理第一篇

蔚来Android实习面经一面（2024/3/11 35min）自我介绍聊我的本专业说一说MVP架构，MVVM架构 MVP：V层持有P层，用户点击View，把数据发给P层，P层持有M层，然后P层把V层的数据发给M层获取其他数据，最后M层获取完数据后把数据还给P层，更新V层。P层也有V层的引用。MVVM：V层…

阅读更多...

Qt 去掉QDialog对话框的问号

Qt 去掉QDialog对话框的问号

QT 对话框的问号是什么？ QDialog默认的window flag中包含了Qt::WindowContextHelpButtonHint,这个flag意思是在窗口上提供“上下文帮助”按钮使用方式/调用方式 void QWidget::setWhatsThis(const QString &)比如： ui->lineEdit_1->setWh…

阅读更多...

【pycharm-乱码】简单记录一下都有哪些涉及编码

【pycharm-乱码】简单记录一下都有哪些涉及编码

控制台路径：setting-》general-》console setting-》editor-》file encodings 路径：setting-》editor->file and code templates #!/user/bin/env python3 # -*- coding: utf-8 -*-setting->tools->ssh terminal

阅读更多...

Conda在线/离线迁移虚拟环境

Conda在线/离线迁移虚拟环境

conda简单使用 1.创建环境： conda create -n myenv python3.82.激活环境 conda activate myenv3.退出环境 conda deactivate4.安装包 pip install xxx5.列出所有环境 conda env list conda info --envs6.删除环境 conda remove -n myenv --all离线迁移conda …

阅读更多...

【JavaWeb】JDBCDruidTomcat入门使用

【JavaWeb】JDBCDruidTomcat入门使用

本章使用技术版本： Tomcatv10.1.25 关于javaweb相关的其他技术，比如tomcat和maven，在我的主页记录了笔记，ajax我用的是本地笔记以后再考虑上传，前端三板斧我用的菜鸟教程文档 JDBC 初识 JDBC概念 JDBC 就是使用Jav…

阅读更多...

三、建造者模式

三、建造者模式

构造者模式（Builder Pattern）使用简单的对象一步一步构建成一个复杂的对象。这种设计模式属于创建者模式，它提供了一种创建对象的最佳方式。一个 Builder 类会一步一步构造最终的对象。该 Builder 类是独立于其他对象的。例如，计算…

阅读更多...

LVDS与SerDes到底是什么关系？

LVDS与SerDes到底是什么关系？

随着智能座舱和智能驾驶功能的应用，汽车中的摄像头和液晶屏越来越多，多种图像显示和多屏互动也成为增强汽车智能化和用户体验的重点内容。这些图像显示功能需要在不同的控制器之间或者控制器与远端的液晶屏或摄像头之间进行数据传输。比如中控与仪表之…

阅读更多...

AndroidLogger 适配好了，但没法上架

看到有网友还在用之前的 AndroidLogger 版本，让我感动再次花了 2个月适配新的Notepad，总算搞完了，但是Notepad作者反了，我没法上架啊。演示视频地址： Notepad安卓日志插件，支持文件管理和截屏&#xff0c…

阅读更多...

FreeRTOS学习笔记—②RTOS的认识（持续更新中）

FreeRTOS学习笔记—②RTOS的认识（持续更新中）

由于正在学习韦东山大佬的RTOS课程，结合了网上的一些资料，整理记录了下自己的感悟，用于以后自己的回顾。如有不对的地方请各位大佬纠正。课程链接：https://www.bilibili.com/video/BV1844y1g7ud/?spm_id_from333.337.search-car…

阅读更多...

Elasticsearch 向量数据库本地部署及操作方法

Elasticsearch 向量数据库本地部署及操作方法

elasticsearch是个分布式向量数据库，支持多种查找模式。此外还拥有 Metadata、Filtering、Hybrid Search、Delete、Store Documents、Async等能力。本文仅是记录本地测试途中遇到的问题。一，环境部署下载软件首先去官网，选择适合平台下…

阅读更多...

GoF 代理模式

GoF 代理模式

代理模式的理解代理模式，就是自己做不了，需要别人来代理，代替自己来完成。最终这个行为还是要发生，只不过不是由自己来完成，而是由别人代理完成，只是对于客户其他人来说感受不到代理模式的作用&#xf…

阅读更多...

MySQL复习3

MySQL复习3

视图视图（view）是一种虚拟存在的表，是一个逻辑表，本省没有数据，内容由查询定义。基表：用来创建视图的表叫做基表通过视图，我们可以查看基表的部分数据。视图数据来自定义视图的查询中使用…

阅读更多...

RISC-V （八）定时器中断

RISC-V （八）定时器中断

riscv中断的分类 Core local INTerrupt: CLINT CLINT编程接口-寄存器 mtime寄存器，由中断触发的时钟，按照固定频率计数。

阅读更多...

【基础算法总结】BFS_多源最短路问题

【基础算法总结】BFS_多源最短路问题

目录 1. 算法介绍2. 算法原理和代码实现542.01矩阵1020.飞地的数量1765.地图中的最高点1162.地图分析 3. 算法总结 1. 算法介绍所谓多源，就是有多个起点。对应上一篇文章【BFS_最短路问题】的单源问题。这篇文章介绍用bfs解决边权为1(或边权相等)的多源最短路问题…

阅读更多...

最新文章

推荐文章