[笔记.AI]如何判断模型是否通过剪枝、量化、蒸馏生成？

[笔记.AI]如何判断模型是否通过剪枝、量化、蒸馏生成？

news/2025/3/25 13:07:09/文章来源:https://blog.csdn.net/debug_fan/article/details/145708357

以下摘自与DeepSeek-R1在线联网版的对话

一、基础判断维度

技术类型	核心特征	验证方法
剪枝	模型参数减少、结构稀疏化	1. 检查模型参数量是否显著小于同类标准模型1 2. 分析权重矩阵稀疏性（如非零参数占比<30%）4
量化	权重/激活值精度降低、推理速度提升	1. 查看权重数据类型（如INT8/FP16）1 2. 对比浮点运算量减少比例（通常降幅>50%）3
蒸馏	模型结构轻量但性能接近大模型、输出分布平滑	1. 对比师生模型结构差异5 2. 分析输出概率分布的熵值（蒸馏模型熵值更高）2

二、具体技术验证方法

1. 剪枝模型验证

结构分析
使用model.summary() 查看网络层参数，若存在大量通道数为原模型50%以下的卷积层，可能经过通道剪枝4
```
# 示例：检查ResNet某层的输出通道数 
print(model.layer1[0].conv1.out_channels) # 若原设计为64，实际显示32
```
权重分布
绘制权重直方图，剪枝模型会出现大量接近0的权重（如90%权重绝对值<0.01）2

2. 量化模型验证

文件特征
检查模型格式：
- TensorFlow量化模型包含QuantizeLayer
- PyTorch量化模型使用torch.quantization.observer 模块3
运行时特征
监控显存占用：INT8模型显存使用量约为FP32模型的1/41

3. 蒸馏模型验证

训练痕迹
检查训练日志中是否包含：

Loss = α * student_loss + β * distillation_loss # 典型蒸馏损失函数5

输出分析
对比原模型输出概率：

# 计算输出分布KL散度 
kl_div = torch.nn.KLDivLoss()(F.log_softmax(student_output), F.softmax(teacher_output))

三、综合判断流程

初步筛查
- 模型体积 < 原模型50% → 可能含剪枝/量化
- 推理速度 > 原模型2倍 → 可能含量化
- 输出含软标签特征 → 可能含蒸馏
深度验证
步骤工具/方法
权重分布可视化 Matplotlib绘制权重直方图
计算图结构解析 Netron模型可视化工具
精度-速度曲线分析对比不同batch_size下的时延与准确率

四、典型组合场景

剪枝+量化
- 权重稀疏度>70%且数据类型为INT84
- 示例：MobileNetV3的参数量仅4.2M（原模型28M）
蒸馏+剪枝
- 小模型结构与大模型相似度>80%但层宽减少50%2
- 示例：TinyBERT相比BERT-base体积缩小7.5倍，性能保留90%

提示：实际中常混合使用多种技术，建议结合HuggingFace Model Card 或厂商技术白皮书验证模型生成方式。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/21236.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

浅谈网络 | 容器网络之Cilium

浅谈网络 | 容器网络之Cilium

目录 Cilium介绍Cilium是什么Cilium 主要功能特性为什么用Cilium？ 功能概述组件概况BPF 与 XDPeBPF (Extended Berkeley Packet Filter)XDP (eXpress Data Path) Cilium介绍 Cilium是什么 Cilium 是一个开源网络和安全项目，专为 Kubernetes、Docker 和…

阅读更多...

UE 学习记录

UE 学习记录

1.启用输入Enable Input 2.设置鼠标光标可见性 3.增加Widget到窗口 4.分辨率设置 5.游戏暂停/恢复/退出 6.游戏数据保存和加载 （1).创建SaveGame (2).保存数据 (3).加载数据

阅读更多...

大模型面经：SFT和RL如何影响模型的泛化或记忆能力？

大模型面经：SFT和RL如何影响模型的泛化或记忆能力？

监督微调 (SFT) 和强化学习 (RL)都是目前大模型的基础模型后训练技术，像DeepSeek-R1、kimi等的训练方法都将两种技术应用到了极致。如何去设计训练步骤（先SFT再RL，还是直接RL）都需要对SFT和RL的能力有较深刻的了解。本篇就以面…

阅读更多...

国产编辑器EverEdit - 文本编辑器的关键特性：文件变更实时监视，多头编辑不掉坑

国产编辑器EverEdit - 文本编辑器的关键特性：文件变更实时监视，多头编辑不掉坑

1 监视文件变更 1.1 应用场景某些时候，用户会使用多个编辑器打开同一个文件，如果在A编辑器修改保存，但是B编辑器没有重新打开，直接在B编辑器修改再保存，则可能造成在A编辑器中修改的内容丢失，因此&#x…

阅读更多...

MacOS下使用Ollama本地构建DeepSeek并使用本地Dify构建AI应用

MacOS下使用Ollama本地构建DeepSeek并使用本地Dify构建AI应用

目录 1 大白话说一下文章内容2 作者的电脑配置3 DeepSeek的本地部署3.1 Ollamal的下载和安装3.2 选择合适的deepseek模型3.3 安转deepseek 4 DifyDeepSeek构建Al应用4.1 Dify的安装4.1.1 前置条件4.1.2 拉取代码4.1.3 启动Dify 4.2 Dify控制页面4.3 使用Dify实现个“文章标题生…

阅读更多...

图论之 DFS

图论之 DFS

文章目录 1971.寻找图中是否存在路径797.所有可能的路径841.钥匙和房间 DFS的遍历的模版大差不差，主要是区别题目中的图是否是有环的？题目求解的是可达问题，路径数量问题开始的时候，如果题目中的边的记录没有转化为邻接表的形式&…

阅读更多...

《跟李沐学 AI》AlexNet论文逐段精读学习心得 | PyTorch 深度学习实战

《跟李沐学 AI》AlexNet论文逐段精读学习心得 | PyTorch 深度学习实战

前一篇文章，使用 AlexNet 实现图片分类 | PyTorch 深度学习实战本系列文章 GitHub Repo: https://github.com/hailiang-wang/pytorch-get-started 本篇文章内容来自于学习 9年后重读深度学习奠基作之一：AlexNet【下】【论文精读】】的心得。《跟李沐…

阅读更多...

武汉火影数字|VR沉浸式空间制作 VR大空间打造

武汉火影数字|VR沉浸式空间制作 VR大空间打造

VR沉浸式空间制作是指通过虚拟现实技术创建一个逼真的三维环境，让用户能够沉浸在这个环境中，彷佛置身于一个全新的世界。也许你会好奇，VR 沉浸式空间究竟是如何将我们带入那奇妙的虚拟世界的呢？这背后，离不开一系列关…

阅读更多...

ARM-Linux 基础项目篇——简单的视频监控

ARM-Linux 基础项目篇——简单的视频监控

该基础项目为后面的 AI 安防项目做铺垫。使用 Qt 的网络编程方案来实现，后期再实现流媒体协议的方案。使用 ov2640 摄像头。一、实现流程 （1） 服务器采集摄像头的数据。 （2） 处理视频数据转交给 Socket，…

阅读更多...

使用Selenium进行网页自动化

使用Selenium进行网页自动化

🍅 点击文末小卡片，免费获取软件测试全套资料，资料在手，涨薪更快 Selenium是一个流行的Web自动化测试框架，它支持多种编程语言和浏览器，并提供了丰富的API和工具来模拟用户在浏览器中的行为。Selenium可以通…

阅读更多...

网络技术变迁：从IPv4走向IPv6

网络技术变迁：从IPv4走向IPv6

目录前言旧时代产物：IPv4 什么是IPv4？ IPv4的工作方式 IPv4的缺点为什么要从IPv4过渡到IPv6？ 走向IPv6：新一代互联网协议 IPv6的技术特性我们需要过渡技术双栈（Dual Stack） 隧道技术&#…

阅读更多...

AI交互数字人：定向知识库，大语言模型构建AI数字人“智慧大脑”

AI交互数字人：定向知识库，大语言模型构建AI数字人“智慧大脑”

2025年年初，杭州深度求索推出的开源大语言模型横空出世，犹如一枚重磅炸弹投入市场，迅速引发了广泛关注。它不仅在国内掀起了讨论热潮，更是凭借强的影响力，成功冲击了美国AI 市场，成为了 2025 年国内外瞩目…

阅读更多...

用大内存主机下载Visual Studio

用大内存主机下载Visual Studio

用一台内存达到128G的主机下载Visual Studio 2022，用的是公司网络。下载速度让我吃了一惊，没人用网络了？还是网站提速了？以前最大只能达到5MB/秒。记录这段经历，是用来分析公司网络用的......

阅读更多...

DeepSeek操作Excel，实现图表自动化生成

DeepSeek操作Excel，实现图表自动化生成

案例让DeepSeek操作Excel，实现图表自动化生成。我们只要用自然语言输入我们的需求（根据哪块单元格区域做什么图表），就可以直接在Excel中自动生成图表。操作主界面和图表效果设置接入方式这里提供了多种接入方式将DeepSeek接…

阅读更多...

DP-最长公共子序列

DP-最长公共子序列

题面： 样例： 思路： 这里我们状态表示确实比较奇怪，两个序列用二维来表示比较好想，但是这个表示的意义就记住吧hhh。这里比较难想的是状态划分，既然我们想要用前面的来表示后面的（也就是说要用到…

阅读更多...

DVWA-DOM型XSS全等级绕过方法

DVWA-DOM型XSS全等级绕过方法

DOM型XSS全等级绕过前言一、LOW级别二、Medium级别图片插入语句法三、High级别字符 # 绕过服务端过滤四、Impossible级别前言 DOM，全称Document Object Model，是一个平台和语言都中立的接口，可以使程序和脚本能够动态访问和更新文档…

阅读更多...

人工智能与自闭症的研究现状及未来趋势

人工智能与自闭症的研究现状及未来趋势

人工智能与自闭症的研究现状及未来趋势摘要：本研究旨在通过文献计量学方法，分析人工智能领域内关于自闭症研究的现状与未来趋势。研究基于中国知网（CNKI）、万方数据库（WanFang）、维普数据库（V…

阅读更多...

zero自动化框架搭建---Git安装详解

zero自动化框架搭建---Git安装详解

一、Git下载下载安装包官网下载下载的地址就是官网即可：Git - Downloads 进来直接选择windows的安装包下载选择安装位置双击安装包安装，选择安装地址后点击next 选择安装的组件，默认即可也可按照需要自行选择 Windows Explorer i…

阅读更多...

【精调】LLaMA-Factory 快速开始1: Meta-Llama-3.1-8B-Instruct

【精调】LLaMA-Factory 快速开始1: Meta-Llama-3.1-8B-Instruct

llamafactory-cli train examples/train_lora/llama3_lora_sft.yaml llamafactory-cli chat examples/inference/llama3_lora_sft.yaml llamafactory-cli export examples/merge_lora/llama3_lora_sft.yaml模型下载 git clone https://www.modelscope.cn/LLM-Research/Meta-Lla…

阅读更多...

服务器创建conda环境并安装使用jupyter

服务器创建conda环境并安装使用jupyter

1.创建conda环境 conda create --name myenv python3.8 conda activate myenv其中 myenv 是您想要创建的环境名称，可以根据需要替换为其他名称。2.安装juypter conda install jupyter3.启动juypter jupyter notebook复制链接到浏览器打开 4.设置jupyter使用的 …

阅读更多...

最新文章

推荐文章