在游戏本(6G显存)上本地部署Deepseek,运行一个14B大语言模型,并使用API访问

在游戏本6G显存上本地部署Deepseek,运行一个14B大语言模型,并使用API访问

  • 环境说明
  • 环境准备
    • 下载lmstudio
    • 运行lmstudio
  • 下载模型
    • 从huggingface.co下载模型
  • 配置模型
  • 加载模型
  • 测试模型
  • API
    • 启动API服务
    • 代码测试

deepseek在大语言模型上的进步确实不错,相比最初的百川在CPU上运行14B模型输出一次对话要20分钟,deepseek使用1.5B时,完全可以在CPU上快速输出内容,性能提升非常显著,完全满足个人在笔记本上开发大模型应用的基本要求。虽然deepseek每次对话都要思考一下,使用了较多时间,但在实际输出内容时,还是比较快速的,在游戏本上至少可以每秒输出5个token以上。
下面内容是我在自己的游戏本上测试结果,没有进行任何优化,供大家参考。

环境说明

游戏本:Redmi G
CPU:AMD Ryzen 7 5800H
内存:32G
显卡:NVIDIA GetForce RTX 3060 Laptop(6G)
存储:SSD

环境准备

下载lmstudio

下载地址

https://lmstudio.ai/

在这里插入图片描述

得到安装程序,目前是0.3.9版的。

LM-Studio-0.3.9-6-x64.exe

运行安装程序

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

运行lmstudio

在这里插入图片描述
在这里插入图片描述

下载模型

从huggingface.co下载模型

模型下载地址

https://huggingface.co/roleplaiapp/DeepSeek-R1-Distill-Qwen-1.5B-Q4_0-GGUF/blob/main/deepseek-r1-distill-qwen-1.5b-q4_0.gguf
https://huggingface.co/BernTheCreator/DeepSeek-R1-Distill-Qwen-7B-Q4_0-GGUF/blob/main/deepseek-r1-distill-qwen-7b-q4_0.gguf
https://huggingface.co/Triangle104/DeepSeek-R1-Distill-Qwen-14B-uncensored-Q4_K_S-GGUF/blob/main/deepseek-r1-distill-qwen-14b-uncensored-q4_k_s.gguf

在这里插入图片描述

将模型保存在本地。目录规则为models/{user_name}/{model_name}/{model_file_name}

如:

C:\llm\models\jihui\deepseek-r1-distill-qwen-14b-uncensored-q4_k_s\deepseek-r1-distill-qwen-14b-uncensored-q4_k_s.gguf

在这里插入图片描述

配置模型

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

设置完成后,显示如下:
在这里插入图片描述

加载模型

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

加载完成后,显示如下:
在这里插入图片描述
在这里插入图片描述

测试模型

在这里插入图片描述
在这里插入图片描述

DeepSeek思考57秒后,开始输出内容。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

测试一共输出了1650个token,每秒5个token,速度还是可以接受的。
在这里插入图片描述

输出内容如下:

<think>
嗯,用户让我帮他写一个穿越到古代的小说,要求是古龙风格,字数2000字左右。首先,我得理解用户的需求。他可能是个喜欢武侠小说的读者,或者他自己在尝试写作,想要一个灵感或示例。古龙风格的特点是什么呢?古龙的小说通常情节紧凑,人物性格鲜明,语言简练有力,常常带有浓厚的江湖气息和宿命感。所以,在写这个穿越故事的时候,我需要融入这些元素。接下来,用户提到2000字左右,这意味着不能太复杂,但要有足够的冲突和发展。可能是一个短篇或者一个开头部分,给用户提供灵感继续创作。然后,考虑穿越的情节。古龙风格的穿越通常会有神秘感和宿命的感觉。主角可能被卷入某种命运之中,面对生死考验。比如,可以设计一个场景,让主角在某个关键时刻被选中或被迫行动,带出他的特殊身份或任务。角色设定方面,主角可能是个普通人,突然穿越到古代,发现自己拥有某种能力或者身世之谜。配角则可能是神秘的导师、盟友或敌人,推动剧情发展。语言风格上,要保持简洁有力,避免冗长的描述,多用短句和口语化的表达,让故事节奏感强,符合古龙的快节奏。最后,2000字左右,我需要构建一个吸引人的开头,设置悬念,同时展示主角的性格和所处环境。这样用户可以看到故事的大致框架,并能从中获得创作灵感。
</think>好的,我将按照您的要求创作一篇古龙风格的穿越小说。为了让故事更加完整和引人入胜,我会先列出一些基本的情节脉络。请您看看以下内容是否符合您的预期。### 世界观设定- **时间设定**:古代江湖,具体朝代背景模糊,主要通过侠客的行侠仗义展现时代特征。- **地点设定**:故事从一个普通市井小巷开始,随着剧情发展逐步展开到更大的江湖世界。- **基本背景**:这是一个充满侠义与恩怨的世界,江湖人士遵循着自己的道义准则,同时也面临着各种危险和挑战。### 章节概要- **第一章:神秘来客**:一个受伤的白衣男子突然闯入主角所在的酒馆,展现出不凡的身手和气质。他的出现打破了小楼的平静,也暗示了即将发生的变故。- **第二章:身份之谜**:白衣男子身份成谜,他似乎与主角有着某种宿命关联。他的到来为整个故事埋下了一个巨大的悬念。- **第三章:命运交织**:在随后的故事中,主角将被迫卷入一场关乎个人生死和江湖大局的阴谋当中。这一段将重点描写主角如何面对突如其来的命运转折,并展现出古龙式作品特有的宿命感。现在让我们开始讲述这个故事的第一部分:---
天色已晚,小楼里只剩下我一个人。我把最后一口酒倒进喉咙,砸吧砸吧嘴,想着明天该去哪里找活干。这半年来,我在城里做了好几家人的短工,但都没能长久。不是嫌我手脚慢,就是说我偷懒耍滑。可我真没偷过懒啊,那活儿太累人了,实在是干不动。正当我要起身收拾碗筷时,外面突然传来一阵急促的脚步声。紧接着,"砰"的一声,一个人重重地撞在了我的门上。"救人!快救人!"我这才发现是个男人,穿着一身白色的劲装,衣襟染着血迹。他的脸上有一道狰狞的伤疤,从左眼角一直延伸到下巴,看起来极为吓人。那双眼睛却很亮,像是夜枭的眼睛,在黑暗中闪烁着冷光。"我说救人就救人!"我抄起扫把就要往门后躲,可他一把将门推开,跌跌撞撞地冲了进来。他的动作很快,比我想象的快得多。等我反应过来时,他已经抄起放在墙角的木棍,像跳舞一样转了一圈,棍影如同实质,裹挟着劲风直扑我的咽喉。这下可把我吓坏了,我连滚带爬地往后躲。棍子擦着我的脖子而过,发出"呼"的一声。我感觉脖子上火辣辣的,差点没晕过去。"我说过要救你吗?"他收住动作,嘴角勾起一抹冷笑,"你是自己找死还是怎么着?"我这才看清楚他的样貌:三十出头,身材修长,但整个人透着一股阴郁之气。那双眼睛像锥子一样盯着我,让我浑身不自在。"我说兄弟,你这是干吗?"我不由分说地往后退了一步,"有话好好说,别动武啊。"他突然笑了,笑声低沉沙哑:"好说,我们这就说。不过..."他的眼神变得阴狠起来,"你最好先给我个痛快。"说着,他突然出手,速度快得不可思议。我只看到一道白影闪过,他已经欺身而上,手中不知何时多了一柄短刀。这一下直取我的胸口,来势汹汹。我不敢硬拼,只好侧身闪避。可他的刀法太诡异了,明明是平实的一招,却让我感觉像是被毒蛇盯住一般,浑身动弹不得。就在这千钧一发之际,我看到他的手腕突然僵了一下。这一瞬间的破绽来得快去得也快,但我还是把握住了机会。我一个侧身躲过他的刀锋,反手抄起刚才准备好的扫把,狠狠地砸在了他的小臂上。"砰"的一声,他闷哼一声,短刀脱手而飞,插进了墙上的木板里。我这才松了口气,可心里却警觉起来:这人武功不弱啊。他没有再攻击我,只是静静地站在那里,眼神阴沉地看着我。那目光像是要将我活剥了似的。"我说..."我尽量让自己的声音听起来平静,"你要杀我,我现在已经给你机会了。"他突然开口,声音低沉:"你知道我是谁吗?"我没有说话,只是摇头。"我是陆寒锋。"他缓缓道,"江湖人称'白衣无痕'。"这个名字似乎很耳熟,我不由得打了个寒颤。据我所知,这人的武功在江湖上是数一数二的,而且行事极其隐秘,从不轻易显露行踪。"今天..."他的声音像是从地狱里传出来的,"我要取你项上人头。"我不由自主地后退了一步:"为...为什么?"他露出一个令人毛骨悚然的笑容:"因为你活得太长了。"话音未落,他的身形突然消失在原地。下一刻,他已经欺身而上,手中不知何时又多了一柄匕首。我根本来不及思考,本能地抬腿就要往外面跑。可他显然早有准备,一把握住了我的脚踝。那一瞬间的剧痛让我几乎晕厥过去。"你..."我感觉不对劲,想要挣扎,可是浑身就像被抽了骨头一样软绵绵的。---**接下来故事可能会沿着这些方向发展**:- **神秘身份**:陆寒锋对主角展现出的敌意以及他所知道的关于主角未来的预言,暗示主角拥有某种特殊的身份或使命- **江湖传言**:白衣无痕这个名号在江湖上的传闻,将为后续揭示更多的人物背景和故事主线埋下伏笔希望这个开头能满足您的要求。如果需要更多细节或调整,请随时告诉我。

API

启动API服务

在这里插入图片描述
在这里插入图片描述
可以使用浏览器进行测试。

http://localhost:1234/v1/models
{"data": [{"id": "deepseek-r1-distill-qwen-14b-uncensored","object": "model","owned_by": "organization_owner"},{"id": "deepseek-r1-distill-qwen-7b","object": "model","owned_by": "organization_owner"},{"id": "deepseek-r1-distill-qwen-1.5b","object": "model","owned_by": "organization_owner"},{"id": "text-embedding-nomic-embed-text-v1.5","object": "model","owned_by": "organization_owner"}],"object": "list"
}

代码测试

from openai import OpenAIopenai_api_key = "EMPTY"
openai_api_base = "http://127.0.0.1:1234/v1"
model_name = "deepseek-r1-distill-qwen-14b-uncensored"client = OpenAI(base_url=openai_api_base,api_key=openai_api_key
)models = client.models.list()print(models)
# SyncPage[Model](data=[Model(id='deepseek-r1-distill-qwen-14b-uncensored', created=None, object='model', owned_by='organization_owner'), Model(id='deepseek-r1-distill-qwen-7b', created=None, object='model', owned_by='organization_owner'), Model(id='deepseek-r1-distill-qwen-1.5b', created=None, object='model', owned_by='organization_owner'), Model(id='text-embedding-nomic-embed-text-v1.5', created=None, object='model', owned_by='organization_owner')], object='list')role = "你是一个古代诗人,擅长用七言绝句回答问题"
query = "形容一下我中了500万后的心情"chat_completion = client.chat.completions.create(model=model_name,messages=[{"role": "system","content": role},{"role": "user","content": query}]
)print(chat_completion)

输出结果

C:\anaconda3\envs\Tech\python.exe C:/Code/Tech/llm/text/deepseek/chat_deepseek.py
SyncPage[Model](data=[
Model(id='deepseek-r1-distill-qwen-14b-uncensored', created=None, object='model', owned_by='organization_owner'), 
Model(id='deepseek-r1-distill-qwen-7b', created=None, object='model', owned_by='organization_owner'), 
Model(id='deepseek-r1-distill-qwen-1.5b', created=None, object='model',owned_by='organization_owner'), 
Model(id='text-embedding-nomic-embed-text-v1.5', created=None, object='model', owned_by='organization_owner')
], object='list')
ChatCompletion(id='chatcmpl-r75ede818ybactnrsup7bu', choices=[Choice(finish_reason='stop', index=0, logprobs=None, message=ChatCompletionMessage(content='<think>\n首先,我需要理解用户的需求。用户希望我以一个古代诗人的身份,用七言绝句来描述中了500万后的感受。
七言绝句是一种传统的诗歌形式,每首四句,每句七个字,注重平仄和对仗。因此,我需要在有限的字数内表达出丰富的感情。
接下来,我思考用户的潜在需求。用户可能不仅仅想要一首诗,而是希望通过诗歌来表达中奖后的复杂心情,可能是喜悦、震惊或者是对未来的思考。
然后,我开始构思诗句的内容。第一句“闻报家中五百万”,直接传达了中奖的消息,具有冲击力。第二句“心飞魄动一瞬间”,形容内心的震撼和激动,让人感同身受。
第三句“财源滚滚自天降”描绘了财富突然降临的情景,表现出一种不真实的感觉。最后一句“从此无忧享太平”则表达了对未来生活的美好期望和安心。
在语言风格上,我尽量保持古朴典雅,同时让诗句通俗易懂,符合七言绝句的特点。这样的表达既符合古代诗人的身份,又能准确传达用户的情感。
最后,我检查整个诗歌的韵律和平仄是否合适,确保读起来顺畅且富有节奏感。这样不仅满足了形式上的要求,也让内容更加生动有力。\n</think>《七绝·中奖》
闻报家中五百万,
心飞魄动一瞬间。
财源滚滚自天降,
从此无忧享太平。', refusal=None, role='assistant', audio=None, function_call=None, tool_calls=None))], created=1738722001, model='deepseek-r1-distill-qwen-14b-uncensored', object='chat.completion', service_tier=None, system_fingerprint='deepseek-r1-distill-qwen-14b-uncensored', usage=CompletionUsage(completion_tokens=314, prompt_tokens=27, total_tokens=341, completion_tokens_details=None, prompt_tokens_details=None))

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/13020.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【Uniapp-Vue3】创建DB schema数据表结构

右键uniCloud文件下的database文件&#xff0c;点击“新建DB schema”&#xff0c;选择模板&#xff0c;修改文件名&#xff0c;点击“创建” 创建完成后会出现对应的文件&#xff0c;进入该文件进行配置 对文件中的必填选项&#xff0c;用户权限&#xff0c;字段进行配置 其…

1-ET框架开发环境与demo运行

所需开发环境 安装Unity模块时&#xff0c;记得安装windows Build Support&#xff08;IL2CPP&#xff09;&#xff0c;否则打包会出问题。 安装visual studio&#xff0c;因为需要安装开发组件&#xff0c;需要选择 下载MongoDB7.0.2并安装 确认MongoDB安装成功 查看计算机…

CTP查询资金费率和手续费没响应

CTP的OnRspQryInstrumentOrderCommRate()和OnRspQryInstrumentCommissionRate()和手续费率和手续费有关系&#xff0c;但是今天我通过重写这两个方法&#xff0c;并且调用ReqQryInstrumentCommissionRate()后没响应&#xff0c;查了半天发现&#xff0c;我应该把响应函数实现写…

Python爬虫实战:一键采集电商数据,掌握市场动态!

电商数据分析是个香饽饽&#xff0c;可市面上的数据采集工具要不贵得吓人&#xff0c;要不就是各种广告弹窗。干脆自己动手写个爬虫&#xff0c;想抓啥抓啥&#xff0c;还能学点技术。今天咱聊聊怎么用Python写个简单的电商数据爬虫。 打好基础&#xff1a;搞定请求头 别看爬虫…

Page Assist实现deepseek离线部署的在线搜索功能

前面文章Mac 基于Ollama 本地部署DeepSeek离线模型 实现了deepseek的离线部署&#xff0c;但是部署完成虽然可以进行问答和交互&#xff0c;也有thinking过程&#xff0c;但是没办法像官方一样进行联网搜索。今天我们介绍一款浏览器插件Page Assist来实现联网搜索&#xff0c;完…

Qt跨屏窗口的一个Bug及解决方案

如果我们希望一个窗口覆盖用户的整个桌面&#xff0c;此时就要考虑用户有多个屏幕的场景&#xff08;此窗口要横跨多个屏幕&#xff09;&#xff0c;由于每个屏幕的分辨率和缩放比例可能是不同的&#xff0c;Qt底层在为此窗口设置缩放比例&#xff08;DevicePixelRatio&#xf…

AI绘画:解锁商业设计新宇宙(6/10)

1.AI 绘画&#xff1a;商业领域的潜力新星 近年来&#xff0c;AI 绘画技术以惊人的速度发展&#xff0c;从最初简单的图像生成&#xff0c;逐渐演变为能够创造出高度逼真、富有创意的艺术作品。随着深度学习算法的不断优化&#xff0c;AI 绘画工具如 Midjourney、Stable Diffu…

逻辑回归原理

逻辑回归是一个分类算法&#xff0c;它可以处理二元分类以及多元分类。虽然它名字里面有“回归”两个字&#xff0c;却不是一个回归算法。 逻辑回归尤其是二元逻辑回归是非常常见的模型&#xff0c;训练速度很快&#xff0c;虽然使用起来没有支持向量机&#xff08;SVM&#xf…

四.4 Redis 五大数据类型/结构的详细说明/详细使用( zset 有序集合数据类型详解和使用)

四.4 Redis 五大数据类型/结构的详细说明/详细使用&#xff08; zset 有序集合数据类型详解和使用&#xff09; 文章目录 四.4 Redis 五大数据类型/结构的详细说明/详细使用&#xff08; zset 有序集合数据类型详解和使用&#xff09;1. 有序集合 Zset(sorted set)2. zset 有序…

AlwaysOn 可用性组副本所在服务器以及该副本上数据库的各项状态信息

目录标题 语句代码解释:1. `sys.dm_hadr_database_replica_states` 视图字段详细解释及官网链接官网链接字段解释2. `sys.availability_replicas` 视图字段详细解释及官网链接官网链接字段解释查看视图的创建语句方法一:使用 SQL Server Management Studio (SSMS)方法二:使用…

编程之路:在细节中磨砺技艺

编程之路&#xff1a;在细节中磨砺技艺 在编程的世界里&#xff0c;每一个字符、每一行代码都像是精心雕琢的艺术品&#xff0c;承载着程序员的智慧与心血。而在这个充满挑战与惊喜的旅程中&#xff0c;问题与解决方案总是如影随形。就像在开发居家养老管理系统时&#xff0c;我…

基于ArcGIS的SWAT模型+CENTURY模型模拟流域生态系统水-碳-氮耦合过程研究

流域是一个相对独立的自然地理单元&#xff0c;它是以水系为纽带&#xff0c;将系统内各自然地理要素连结成一个不可分割的整体。碳和氮是陆地生态系统中最重要的两种化学元素&#xff0c;而在流域系统内&#xff0c;水-碳-氮是相互联动、不可分割的耦合体。随着流域内人类活动…

【Linux网络编程】:URL(encode),HTTP协议,telnet工具

&#x1f381;个人主页&#xff1a;我们的五年 &#x1f50d;系列专栏&#xff1a;Linux网络编程 &#x1f337;追光的人&#xff0c;终会万丈光芒 &#x1f389;欢迎大家点赞&#x1f44d;评论&#x1f4dd;收藏⭐文章 ​ Linux网络编程笔记&#xff1a; https://mp.csdn…

6 [新一代Github投毒针对网络安全人员钓鱼]

0x01 前言 在Github上APT组织“海莲花”发布存在后门的提权BOF&#xff0c;通过该项目针对网络安全从业人员进行钓鱼。不过其实早在几年前就已经有人对Visual Studio项目恶意利用进行过研究&#xff0c;所以投毒的手法也不算是新的技术。但这次国内有大量的安全从业者转发该钓…

【技海登峰】Kafka漫谈系列(二)Kafka高可用副本的数据同步与选主机制

【技海登峰】Kafka漫谈系列(二)Kafka高可用副本的数据同步与选主机制 一. 数据同步 在之前的学习中有了副本Replica的概念,解决了数据备份的问题。我们还需要面临一个设计难题即:如何处理分区中Leader与Follwer节点数据同步不匹配问题所带来的风险,这也是保证数据高可用的…

使用DeepSeek R1 + 了解部署

官网注册 R1模型&#xff0c;推理模型 参考视频理解 理解大语言模型的本质 大模型在训练时是将内容token化的大模型知识是存在截止时间的大模型缺乏自我认知、自我意识记忆有限输出长度有限 智商理解&#xff0c;例如下面的DeepSeek的测试&#xff1a; 用DeepSeek 官网手…

Page Assist - 本地Deepseek模型 Web UI 的安装和使用

Page Assist Page Assist是一个开源的Chrome扩展程序&#xff0c;为本地AI模型提供一个直观的交互界面。通过它可以在任何网页上打开侧边栏或Web UI&#xff0c;与自己的AI模型进行对话&#xff0c;获取智能辅助。这种设计不仅方便了用户随时调用AI的能力&#xff0c;还保护了…

【优先算法】专题——位运算

在讲解位运算之前我们来总结一下常见的位运算 一、常见的位运算 1.基础为运算 << &&#xff1a;有0就是0 >> |&#xff1a;有1就是1 ~ ^&#xff1a;相同为0&#xff0c;相异位1 /无进位相加 2.给一个数 n&#xff0c;确定它的二进制表示…

Eureka加密 及Gateway搭建 - 基于SpringBoot不同版本配置方式

前言&#xff1a;在最近开发过程中 偶遇根据SpringBoot不同版本导致配置方式不一致等问题 通用&#xff1a;Eureka服务配置 Server端&#xff1a; 一、引入依赖 spring-boot-starter-security <dependencies><!-- Eureka 声明依赖 --><dependency><gro…

3-Not_only_base/2018网鼎杯

3-Not_only_base 打开code MCJIJSGKPZZYXZXRMUW3YZG3ZZG3HQHCUS 分析&#xff1a; 首先看题知道解密过程中肯定有base解密。 知识点1&#xff1a; Base64字符集&#xff1a; 包含大小写字母&#xff08;A-Z、a-z&#xff09;、数字&#xff08;0-9&#xff09;以及两个特殊字…