深入探究LLamaFactory推理DeepSeek蒸馏模型时无法展示＜think＞思考过程的问题

深入探究LLamaFactory推理DeepSeek蒸馏模型时无法展示＜think＞思考过程的问题

news/2025/3/9 10:55:17/文章来源:https://blog.csdn.net/jining11/article/details/146019127

文章目录

- 问题背景
- 初始测试与问题发现
- - LLaMA Factory测试结果
  - 对照实验：Ollama测试
- 系统性排查与解决方案探索
- - 1. 尝试更换模板
  - 2. 深入研究官方文档
  - 3. 自定义模板实现
- 优化界面展示：实现思考过程的可视化
- - 实现方法
  - 参数调整影响分析
  - - 实验一
    - 实验二

🎉进入大模型应用与实战专栏 | 🚀查看更多专栏内容

问题背景

最近在本地环境中部署了DeepSeek-R1-Distill-Qwen-1.5B，即由Qwen2.5-Math-1.5B基础模型蒸馏出来的具有思维能力的模型。这是一个由Qwen2.5-Math-1.5B基础模型蒸馏出来的、据说具有增强思维能力的小型语言模型。然而，在实际使用过程中，我发现模型似乎并未展示出预期的思维过程，这引发了我对如何正确配置和优化这类模型的深入探究。

在这里插入图片描述

初始测试与问题发现

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/29044.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

从零开始在Windows使用VMware虚拟机安装黑群晖7.2系统并实现远程访问

从零开始在Windows使用VMware虚拟机安装黑群晖7.2系统并实现远程访问

文章目录前言1.软件准备2. 安装VMware17虚拟机3.安装黑群晖4. 安装群晖搜索助手5. 配置黑群晖系统6. 安装内网穿透6.1 下载cpolar套件6.2 配置群辉虚拟机6.3 配置公网地址6.4 配置固定公网地址总结前言本文主要介绍如何从零开始在Windows系统电脑使用VMware17虚拟机安装黑…

阅读更多...

康谋分享 | 3DGS：革新自动驾驶仿真场景重建的关键技术

随着自动驾驶技术的迅猛发展，构建高保真、动态的仿真场景成为了行业的迫切需求。传统的三维重建方法在处理复杂场景时常常面临效率和精度的挑战。在此背景下，3D高斯点阵渲染（3DGS）技术应运而生，成为自动驾驶仿真场景重…

阅读更多...

WPS AI+office-ai的安装、使用

WPS AI+office-ai的安装、使用

** 说明：WPS AI和OfficeAI是两个独立的AI助手，下面分别简单讲下如何使用 ** WPS AI WPS AI是WPS自带AI工具打开新版WPS，新建文档后就可以看到菜单栏多了一个“WPS AI”菜单，点击该菜单，发现下方出现很多菜单&#xf…

阅读更多...

MacOS Big Sur 11 新机安装brew wget python3.12 exo

MacOS Big Sur 11 新机安装brew wget python3.12 exo

MacOS Big Sur 11,算是很老的系统了，所以装起来有点费劲。首先安装brew 按照官网的方法，直接执行下面语句即可安装： export HOMEBREW_BREW_GIT_REMOTE"https://githubfast.com" # put your Git mirror of Homebrew/brew here …

阅读更多...

python-leetcode-一和零

python-leetcode-一和零

474. 一和零 - 力扣（LeetCode）这道题是一个典型的 0-1 背包问题，需要用动态规划（DP）来求解。解题思路 1. 定义状态设 dp[i][j] 表示最多有 i 个 0 和 j 个 1 时，可以获得的最大子集的大小。 2. 状态转移方程对于 strs 中的每个字符串 s：计算 s 中 0 和 1 的个数…

阅读更多...

【杂谈】信创电脑华为w515（统信系统）登录锁定及忘记密码处理

【杂谈】信创电脑华为w515（统信系统）登录锁定及忘记密码处理

华为w515麒麟芯片版，还有非麒麟芯片版本，是一款信创电脑，一般安装的UOS系统。准备一个空U盘，先下载镜像文件及启动盘制作工具，连接如下： 百度网盘请输入提取码 http://livecd.uostools.com/img/apps/l…

阅读更多...

安卓免费工具：海量素材助力个性化头像制作

安卓免费工具：海量素材助力个性化头像制作

软件介绍今天要给大家介绍的软件是DIY头像生成，这是一款超有创意的头像制作工具，可在安卓系统使用，而且它完全免费。在使用手机的过程中，大家肯定都想拥有一个独特又好看的头像。DIY头像生成就能满足这个需求，它内…

阅读更多...

K8S高可用集群-小白学习之二进制部署（ansible+shell）

K8S高可用集群-小白学习之二进制部署（ansible+shell）

一.K8S高可用集群配置概述序言：本文从一个小白的视角进行K8S的研究和部署，采用二进制的方式是为了更清楚了分解部署流程及了解这个集群是怎么运作的，加上ansible+shell是方便在这个过程中，遇到了问题，我们可以不断的快速重复部署来测试和研究问题的所在点，本文的架构图…

阅读更多...

数据库系统概论（一）详细介绍数据库与基本概念

数据库系统概论（一）详细介绍数据库与基本概念

数据库系统概论（一）介绍数据库与基本概念前言一、什么数据库1.数据库的基本概念2.数据库的特点二、数据库的基本概念1. 数据2. 数据库3.数据库管理系统4.数据库系统三、数据管理技术的产生和发展四、数据库系统的特点1.数据结构化2.数据共享性3.数据冗…

阅读更多...

threejs:着色器onBeforeCompile给导入的模型添加光带扫描效果

threejs:着色器onBeforeCompile给导入的模型添加光带扫描效果

模型材质属性丢失上一篇博客我们学习了用着色器给模型添加光带扫描效果，今天来学习给导入的模型添加光带扫描效果，目标是给如下图的立筒仓加光带扫描。首先我们试试原来的方法还是否有效。 import * as THREE from three;// 引入gltf模型加载库GLTFL…

阅读更多...

Python----数据分析（Matplotlib五：pyplot的其他函数，Figure的其他函数， GridSpec）

Python----数据分析（Matplotlib五：pyplot的其他函数，Figure的其他函数， GridSpec）

一、pyplot的其他函数 1.1、xlabel 在matplotlib中， plt.xlabel() 函数用于为当前活动的坐标轴（Axes）设置x轴的标签。当你想要标识x轴代表的数据或单位时，这个函数非常有用。 plt.xlabel(xlabel text) 1.2、ylabel 在matplotl…

阅读更多...

基于GeoTools的GIS专题图自适应边界及高宽等比例生成实践

基于GeoTools的GIS专题图自适应边界及高宽等比例生成实践

目录前言一、原来的生成方案问题 1、无法自动读取数据的Bounds 2、专题图高宽比例不协调二、专题图生成优化 1、直接读取矢量数据的Bounds 2、专题图成果抗锯齿 3、专题成果高宽比例自动调节三、总结前言在当今数字化浪潮中，地理信息系统（…

阅读更多...

aardio - 虚表 + 数据库操作例程

aardio - 虚表 + 数据库操作例程

import godking.vlistEx; import fonts.fontAwesome import win.ui; /*DSG{{*/ mainForm win.form(text"客户信息管理";right967;bottom556;border"none") mainForm.add( addData{cls"plus";text\uF067 新增;left8;top80;right77;bottom110;bgc…

阅读更多...

SQLAlchemy系列教程：理解SQLAlchemy元数据

SQLAlchemy系列教程：理解SQLAlchemy元数据

SQLAlchemy是Python开发人员的强大ORM工具。SQLAlchemy中的元数据是对象-关系映射配置的集合，允许开发人员无缝地定义和使用数据库模式。使用元数据 SQLAlchemy中的元数据充当各种数据库描述符（如表、列和索引）的容器。这使开发人员能够通…

阅读更多...

Soul 1.4.60 | 清爽版浏览器，内置广告拦截与多功能集成，保护隐私

Soul 1.4.60 | 清爽版浏览器，内置广告拦截与多功能集成，保护隐私

Soul浏览器是一款专注于内容浏览体验的安卓浏览器，去除广告与追踪器，集成视频下载、PDF查看、手势控制等实用功能。支持无痕模式与黑暗主题，内置清洁器自动过滤广告，优化网页加载速度，提供流畅的浏览体验与隐私保护。支…

阅读更多...

最短路问题

最短路问题

Problem - D - Codeforces（最短路，反向bfs） 题目： 思路： bfs版本：参考自Codeforces Round 1002 (Div. 2) A - D - 知乎代码： dijstra： void solve() {int n;cin>>n;int s…

阅读更多...

【论文阅读】多模态——LSeg

【论文阅读】多模态——LSeg

文献基本信息标题：Language-Driven Semantic Segmentation作者：Boyi Li、Kilian Q. Weinberger、Serge Belongie、Vladlen Koltun、Ren Ranftl单位：Cornell University、University of Copenhagen、Apple、Intel Labs会议/期刊：…

阅读更多...

Docker Desktop常见问题记录

Docker Desktop常见问题记录

1.docker pull报错，无法连接https://registry-1.docker.io/v2/ 报错信息如下： Error response from daemon: Get "https://registry-1.docker.io/v2/": net/http: request canceled while waiting for connection(Client.Timeout exceeded …

阅读更多...

Java 大视界 -- Java 大数据在智能政务公共服务资源优化配置中的应用（118）

Java 大视界 -- Java 大数据在智能政务公共服务资源优化配置中的应用（118）

💖亲爱的朋友们，热烈欢迎来到青云交的博客！能与诸位在此相逢，我倍感荣幸。在这飞速更迭的时代，我们都渴望一方心灵净土，而我的博客正是这样温暖的所在。这里为你呈上趣味与实用兼具的知识，也…

阅读更多...

Python快捷手册

Python快捷手册

Python快捷手册后续会陆续更新Python对应的依赖或者工具使用方法文章目录 Python快捷手册[toc]1-依赖1-词云小工具2-图片添加文字3-BeautifulSoup网络爬虫4-Tkinter界面绘制5-PDF转Word 2-开发1-多线程和队列 3-运维1-Requirement依赖2-波尔实验室3-Anaconda3使用教程4-CentO…

阅读更多...

最新文章

推荐文章