使用Ollama+OpenWebUI本地部署Gemma谷歌AI开放大模型完整指南

🏡作者主页:点击! 

🤖AI大模型部署与应用专栏:点击!

🤖Ollama部署LLM专栏:点击!

⏰️创作时间:2024年6月4日10点50分

🀄️文章质量:96分


目录

💥Ollama介绍

➡️主要特点

➡️主要优点

🎊Gemma模型

➡️特点

🤖部署教程

1.下载Ollama

2.下载Gemma的大模型

主要版本及其特点

1. Gemma Latest

2. Gemma 7B

3. Gemma 2B

4. Gemma Instruct

5. Gemma Text

6. Gemma v1.1

🎁第一种下载方式

🎁第二种方式下载

🎁注意事项


💥Ollama介绍

Ollama是一个开源框架,专为在本地机器上便捷部署和运行大型语言模型(LLM)而设计。它提供了一套简单的工具和命令,使任何人都可以轻松地启动和使用各种流行的LLM,例如GPT-3、Megatron-Turing NLG和WuDao 2.0。

➡️主要特点


简化部署: Ollama 使用 Docker 容器技术来简化大型语言模型的部署和管理。用户只需简单的命令即可启动和停止模型,而无需担心底层的复杂性。

丰富的模型库: Ollama 提供了丰富的预训练模型库,涵盖了各种自然语言处理任务,如文本生成、翻译、问答等。用户可以轻松地选择和使用所需的模型。

跨平台支持: Ollama 支持多种操作系统,包括 Windows、macOS 和 Linux,使其能够满足不同用户的需求。

灵活的自定义: Ollama 提供了灵活的自定义选项,允许用户根据自己的需求调整模型的行为。

➡️主要优点


离线使用: Ollama 可以让用户在离线环境下使用LLM,这对于隐私敏感或网络连接不稳定的情况非常有用。

降低成本: Ollama 可以帮助用户降低使用LLM的成本,因为它避免了云服务的高昂费用。

提高安全性: Ollama 可以提高LLM使用的安全性,因为它允许用户完全控制自己的数据和模型。

应用场景
研究和教育: Ollama 可以用于自然语言处理、机器翻译、人工智能等领域的教学和研究。

开发和测试: Ollama 可以用于开发和测试新的自然语言处理应用程序。

个人使用: Ollama 可以用于个人创作、娱乐等目的

示例模型
以下只是部分模型:

ModelParametersSizeDownload
Llama 38B4.7GBollama run llama3
Llama 370B40GBollama run llama3:70b
Phi 3 Mini3.8B2.3GBollama run phi3
Phi 3 Medium14B7.9GBollama run phi3:medium
Gemma2B1.4GBollama run gemma:2b
Gemma7B4.8GBollama run gemma:7b
Mistral7B4.1GBollama run mistral
Moondream 21.4B829MBollama run moondream
Neural Chat7B4.1GBollama run neural-chat
Starling7B4.1GBollama run starling-lm
Code Llama7B3.8GBollama run codellama
Llama 2 Uncensored7B3.8GBollama run llama2-uncensored
LLaVA7B4.5GBollama run llava
Solar10.7B6.1GBollama run solar

🎊Gemma模型

谷歌的Gemma AI模型是一个多版本的开放式人工智能系统,旨在处理各种复杂的任务,如自然语言处理、计算机视觉、生成模型等。Gemma AI模型在不同版本之间具有不同的功能和性能,以满足不同的需求和计算资源。

➡️特点

高性能:Gemma在多个基准测试中展现出优秀的性能,能够生成高质量的自然语言内容。

多任务学习:Gemma通过在多个任务上进行联合训练,学习到了通用的语言理解和生成能力。

安全可靠:Gemma被设计具有较高的安全性,可以避免产生有害或不恰当的输出。

可解释性:Gemma模型的内部工作机制相对更加透明,便于理解和分析。

开放获取:Gemma模型的一些版本已经对外开放,研究人员和开发者可以获取使用。

🤖部署教程

1.下载Ollama

官网地址:点击跳转!

下一步默认下载即可过程十分简单就不演示了

2.下载Gemma的大模型

点击官网的右上角Models

选择对应的模型根你的电脑|服务器性能来选择,这里我选择7b的模型来测试

主要版本及其特点
1. Gemma Latest
  • 描述:最新版本的Gemma AI模型,包含最新的优化和改进。
  • 性能:通常是所有版本中性能最强的,能够处理最复杂的任务。
  • 应用场景:适用于需要高精度和高效率的任务,如实时语言翻译、复杂的对话系统、详细的文本分析等。
  • 硬件要求
    • CPU:多核高性能处理器(如Intel Xeon或AMD EPYC)
    • 内存:64GB RAM或更多
    • 存储:至少1TB的可用存储空间
    • GPU:顶级显卡
2. Gemma 7B
  • 描述:参数量为70亿的模型版本,平衡了性能和计算资源需求。
  • 性能:适合中等规模的任务,能够提供高质量的输出,但对计算资源的要求较低。
  • 应用场景:用于中等复杂度的任务,如高级文本生成、图像识别和中等规模的数据处理。
  • 硬件要求
    • CPU:八核处理器(如Intel i7或AMD Ryzen 7)
    • 内存:16GB RAM
    • 存储:至少200GB的可用存储空间
    • GPU:中高端显卡
3. Gemma 2B
  • 描述:参数量为20亿的模型版本,适用于基础的AI任务。
  • 性能:可以高效地处理基础任务,资源消耗较少。
  • 应用场景:适用于简单的文本生成、基础数据分析和基本对话系统。
  • 硬件要求
    • CPU:四核处理器(如Intel i5或AMD Ryzen 5)
    • 内存:8GB RAM
    • 存储:至少100GB的可用存储空间
    • GPU:入门级显卡
4. Gemma Instruct
  • 描述:专门优化用于指令跟随任务的模型版本。
  • 性能:在任务指令执行和精确回答问题方面表现优异。
  • 应用场景:用于构建高效的对话系统、问答系统和智能助理。
  • 硬件要求
    • CPU:六核处理器(如Intel i7或AMD Ryzen 5)
    • 内存:16GB RAM
    • 存储:至少150GB的可用存储空间
    • GPU:中端显卡(如NVIDIA RTX 3060)
5. Gemma Text
  • 描述:专注于文本生成和自然语言处理任务的模型版本。
  • 性能:在生成高质量文本和处理语言任务方面表现卓越。
  • 应用场景:用于自动写作、内容生成、文本摘要和语言翻译。
  • 硬件要求
    • CPU:六核处理器(如Intel i7或AMD Ryzen 5)
    • 内存:16GB RAM
    • 存储:至少150GB的可用存储空间
    • GPU:中端显卡
6. Gemma v1.1
  • 描述:Gemma模型的第一个主要版本更新,包含显著改进和优化。
  • 性能:相比初始版本具有更好的性能和更高的效率。
  • 应用场景:广泛应用于各类任务,包括文本生成、数据分析和对话系统。
  • 硬件要求
    • CPU:八核处理器(如Intel i7或AMD Ryzen 7)
    • 内存:16GB RAM
    • 存储:至少200GB的可用存储空间
    • GPU:中高端显卡

以上只作为参考建议,具体根据官网查

这里我选择7b的模型来测试

有两种下载方式你可以通过

🎁第一种下载方式

命令行(打开cmd)输入官网复制的命令

在命令行输入 以下命令 等待时长即可下载完成

ollama run gemma:7b

🎁第二种方式下载

基于OpenWebUI下载

首先需要安装Docker容器(自行了解安装,去官网下载步骤也是十分的简单)

复制这条命令( Ollama 在您的计算机上使用以下命令)

不同的条件下,有不同的命令,详细见开源地址所述

 官网地址:点击跳转!

docker run -d -p 3000:8080 --add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:main

等待完成即可

安装完成之后访问本地的3000端口

也可以点击自己的Docker,点击访问即可

先点击左下角的设置改为中文简体(方便观看)

点击模型这边下载Gemma 复制官网的运行地址也就是命令输入的命令

此刻只需等待完成即可

下载完成之后上边会显示(你所下载的大模型)

简单的提问

电脑性能越高回答的速度就越快

问题:谈谈你对于AI大爆发的看法

回答

工智能大爆发的看法:人工智能(AI)大爆发将对人类社会产生深远的影响,并带来各种机遇和挑战。积极影响:**提高生产力:**AI工具可以自动化许多任务,提高工作效率和生产力。**提高生活水平:**AI技术可以提供个性化医疗保健、交通和购物体验。**解决重大问题:**AI可以帮助解决全球性挑战,例如气候变化和疾病。**创造新就业机会:**AI技术将创造新的就业机会,以支持新技术和创新。负面影响:**就业损失:**AI工具可能会导致某些工作被自动化,并导致就业损失。**社会影响:**AI技术可能会导致社会分化和个人数据隐私问题。**伦理问题:**AI工具的应用引入了伦理问题,例如 bias 和可持续性。**人类社会:**AI技术可能会对人类社会产生深远的影响,并改变人类与机器的互动方式。可能性:**混合工作模式:**AI技术可以与人类工作相辅相成,以提高效率和生产力。**个人定制:**AI技术可以提供个性化产品和服务,以满足个人的需求和喜好。**社会协作:**AI技术可以帮助人类解决复杂的问题,并改善人类生活。结论:AI大爆发将对人类社会产生深远的影响,既有积极的影响也有负面影响。重要的是要负责任地应用 AI 技术,以最大限度地提高其益处,同时缓解潜在的风险。

可以看出回答的也是十分的全面详细,并且做出相应的总结

但是在回答问题的过程中会占用你的CPU和内存

🎁注意事项

根据电脑性能,来下载对应的大模型

如果是服务器的话,可根据开源地址所说明下载

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/343970.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

google keybox.xml格式 内容有哪些 Keybox数量、设备ID、算法的 私钥 公钥 证书链 (ECDSA即ECC, RSA)

根据您提供的文件内容,keybox.xml 文件包含以下主要信息: Keybox数量 ([NumberOfKeyboxes](file:///d%3A/010F200/svn/ProduceToolMfc/FtSmartPos/FtSmartPos/ToolBydMes/httpclient/e%3A%5CGoogleKey%5CLinux_AttestationKeyboxPack_Tool%5CLinux_Atte…

微服务架构-正向治理与治理效果

目录 一、正向治理 1.1 概述 1.2 效率治理 1.2.1 概述 1.2.2 基于流量录制和回放的测试 1.2.3 基于仿真环境的测试 1.3 稳定性治理 1.3.1 概述 1.3.2 稳定性治理模型 1.3.3 基于容器化的稳定性治理 1.3.3.1 概述 1.3.3.2 测试 1.3.3.3 部署 1.3.3.3.1 概述 1.3.3…

matlab 计算三维空间点到直线的距离

目录 一、算法原理二、代码实现三、结果展示四、参考链接本文由CSDN点云侠原创,原文链接。如果你不是在点云侠的博客中看到该文章,那么此处便是不要脸的爬虫与GPT。 一、算法原理 直线的点向式方程为: x − x 0 m = y

IEDA 默认集成依赖概述

IEDA 默认集成依赖概述 目录概述需求: 设计思路实现思路分析 1.Developer Tools:GraalVM Native supportGraphQL DGs Code GenerationSpring Boot DevToolsLombokSpring Configuration ProcessorDocker Compose supportSpring Modulith 2.WebWebSpring WebSpring Re…

应用层——HTTP协议(自己实现一个http协议)——客户端(浏览器)的请求做反序列化和请求分析,然后创建http向响应结构

应用层:之前我们写的创建套接字,发送数据,序列化反序列化这些都是在写应用层 我们程序员写的一个个解决我们实际问题, 满足我们日常需求的网络程序, 都是在应用层 之前的网络计算机是我们自定义的协议:传输的数据最终是什么样的结…

【NetTopologySuite类库】C#生成带约束(线、面)的Delaunay三角网

介绍 API地址:https://nettopologysuite.github.io/NetTopologySuite/api/NetTopologySuite.Triangulate.ConformingDelaunayTriangulationBuilder.html#NetTopologySuite_Triangulate_ConformingDelaunayTriangulationBuilder_Constraints 约束为线 效果图 红色…

基于SSM+Jsp的高校信息资源共享平台

开发语言:Java框架:ssm技术:JSPJDK版本:JDK1.8服务器:tomcat7数据库:mysql 5.7(一定要5.7版本)数据库工具:Navicat11开发软件:eclipse/myeclipse/ideaMaven包…

海康威视综合安防管理平台 多处 FastJson反序列化RCE漏洞复现

0x01 产品简介 海康威视综合安防管理平台是一套“集成化”、“智能化”的平台,通过接入视频监控、一卡通、停车场、报警检测等系统的设备。海康威视集成化综合管理软件平台,可以对接入的视频监控点集中管理,实现统一部署、统一配置、统一管理和统一调度。 0x02 漏洞概述 由于…

【Redis】 Redis 集成到 Spring Boot上面

文章目录 🍃前言🎄Spring Boot连接redis客户端🚩项目的创建🚩配置端⼝转发🚩配置 redis 服务地址🚩更改 Redis 配置文件🚩使用 StringRedisTemplate 类操作 🎍Spring Boot操作Redis客…

JAVA网络编程,反射及注解知识总结

文章目录 网络编程软件架构三要素IP端口号协议UDP协议发送数据接收数据三种通信方式 TCP协议客户端服务器端三次握手四次挥手 反射获取字节码文件获取构造方法获取成员变量获取成员方法反射的作用 动态代理注解作用格式使用位置注解的原理常见注解元注解自定义注解解析注解 网络…

安装windows11系统跳过微软账号登录,使用本地账号登录方法

在安装win11系统,进行到如图下所示界面的时候,暂停下 我们可以按下键盘的ShiftF10按键(部分电脑是FnShiftF10),这时屏幕会出现命令行窗口,如图下所示 我们需要在命令行内输入代码oobe\bypassnro.cmd然后回车…

[AI Google] 双子座模型家族迎来新突破:更快的模型、更长的上下文、AI代理等更多功能

Google发布了Gemini模型家族的更新,包括新的1.5 Flash模型,该模型旨在提高速度和效率,以及Project Astra,这是对未来AI助手愿景的展示。1.5 Flash是专为大规模高频任务优化的轻量级模型,具有突破性的长上下文窗口。同时…

积累常用css

1、封面文字,垂直居中,可以两列并排 font-size: 20px;font-weight: 600;color: #333;line-height: 20px;display: block;word-wrap: break-word;writing-mode: vertical-lr;height: 160px;margin: 0 auto; 2、宽border效果 .dashed-box { margin: 80px…

超详解——识别None——小白篇

目录 1. 内建类型的布尔值 2. 对象身份的比较 3. 对象类型比较 4. 类型工厂函数 5. Python不支持的类型 总结: 1. 内建类型的布尔值 在Python中,布尔值的计算遵循如下规则: None、False、空序列(如空列表 [],空…

webapi跨越问题

由于浏览器存在同源策略,为了防止 钓鱼问题,浏览器直接请求才不会有跨越的问题 浏览器要求JavaScript或Cookie只能访问同域下的内容 浏览器也是一个应用程序,有很多限制,不能访问和使用电脑信息(获取cpu、硬盘等&#…

YOLOv5车流量监测系统研究

一. YOLOv5算法详解 YOLOv5网络架构 上图展示了YOLOv5目标检测算法的整体框图。对于一个目标检测算法而言,我们通常可以将其划分为4个通用的模块,具体包括:输入端、基准网络、Neck网络与Head输出端,对应于上图中的4个红色模块。Y…

java 类加载器及双亲委派机制

1、 有哪些类加载器 还有自定义类加载器。最上面的为父加载器,加载类的路径是不一样的 2、 什么是双亲委派机制: 1. 加载时,先去找父类,父类无法加载时,在由儿子加载 3、 为什么用双亲委派: 沙箱安全&…

旧衣回收小程序开发,轻松回收旧衣物

随着环保理念的增强,回收市场得到了快速发展,吸引了不少年轻人进入到市场中创业。除了传统的废品回收外,旧衣回收也受到了大众的重视,市场规模迅速扩大,大众浪费的衣物也获得了归处。 目前旧衣回收的方式主要是线上与…

D-Day 上海站回顾丨以科技赋能量化机构业务

5月31日下午,DolphinDB 携手光大证券,在上海成功举办 D-Day 行业交流会。三十余位来自私募机构的核心策略研发、量化交易员、数据分析专家们齐聚现场,深入交流量化投研交易过程中的经验、挑战及解决方案。 DolphinDB 赋能机构业务平台 来自光…