深度学习篇---模型训练评估参数


文章目录

  • 前言
  • 一、Precision(精确率)
    • 1.1定义
    • 1.2意义
    • 1.3数值接近1
    • 1.4数值再0.5左右
    • 1.5数值接近0
  • 二、Recall(召回率)
    • 2.1定义
    • 2.2意义
    • 2.3数值接近1
    • 2.4数值在0.5左右
    • 2.5数值接近0
  • 三、Accuracy(准确率)
    • 3.1定义
    • 3.2意义
    • 3.3数值接近1
    • 3.4数值接近0.5左右
    • 3.5数值接近0
  • 四、F1 值
    • 4.1定义
    • 4.2意义
    • 4.3数值接近1
    • 4.4数值0.5左右
    • 4.5数值接近0
  • 五、ROC 曲线与 AUC
    • 5.1ROC曲线
    • 5.2AUC
    • 5.3AUC接近1
    • 5.4AUC接近0.5
    • 5.5AUC小于0.5
  • 六、平均绝对误差(MAE)
    • 6.1定义
    • 6.2意义
    • 6.3数值接近0
    • 6.4数值较大
  • 七、均方误差(MSE)
    • 7.1定义
    • 7.2意义
    • 7.3数值接近0
    • 7.4数值较大


前言

本文简单介绍了深度学习中模型训练好坏的评估参数。


一、Precision(精确率)

1.1定义

定义:预测为正例的样本中,真正为正例的比例。计算公式为:
Precision= TP/(TP+FP)
其中TP(True Positive)表示真正例,即实际为正例且被预测为正例的样本数量;FP(False Positive)表示假正例,即实际为负例但被预测为正例的样本数量。

1.2意义

意义:精确率反映了模型预测出的正例中真正正确的比例,用于衡量模型预测正例的准确性。例如,在垃圾邮件分类中,精确率高意味着模型预测为垃圾邮件的邮件中,确实是垃圾邮件的比例较高,可减少将正常邮件误判为垃圾邮件的情况。

1.3数值接近1

数值接近 1:说明模型预测为正例的样本中,真正为正例的比例很高。例如在文本分类任务中,若精确率达到 0.9 以上,表明模型预测为某一类别的文本,绝大部分确实属于该类别,模型在识别正例时具有较高的准确性,误判为正例的情况很少。

1.4数值再0.5左右

数值在 0.5 左右:表示模型预测正例的准确性一般,有一半左右预测为正例的样本可能是错误的判断。这意味着模型在区分正例和负例时,存在较大的混淆,可能需要进一步调整模型参数或特征工程,以提高其对正例的精确识别能力。

1.5数值接近0

数值接近 0:说明模型几乎无法准确识别正例,预测为正例的样本中大部分是错误的,模型在正例识别方面表现很差,可能存在严重的过拟合或欠拟合问题,或者数据集中存在噪声干扰等因素影响了模型的判断。

二、Recall(召回率)

2.1定义

定义:实际为正例的样本中,被预测为正例的比例。计算公式为:
Recall= TP/(TP+FN),其中FN(False Negative)表示假反例,即实际为正例但被预测为负例的样本数量。

2.2意义

意义:召回率体现了模型能够正确识别出的正例的能力。在一些场景中,如疾病检测,希望尽可能多地检测出真正患病的人,即使可能会有一些误判,此时召回率就非常重要。较高的召回率表示模型能够找到大部分实际为正例的样本,不会遗漏太多真正的正例。

2.3数值接近1

数值接近 1:表明模型能够几乎找出所有实际为正例的样本。例如在疾病检测场景中,召回率接近 1 意味着几乎所有患病的样本都被模型检测出来了,很少有漏检的情况,模型在捕捉正例方面具有很强的能力。

2.4数值在0.5左右

数值在 0.5 左右:说明模型只能识别出一半左右的实际正例样本,存在较多的漏检情况。这可能是因为模型对正例的特征学习不够充分,或者正例样本在数据集中分布不均衡,导致模型未能很好地学习到正例的各种特征,从而无法准确识别所有正例。

2.5数值接近0

数值接近 0:表示模型几乎无法找到实际的正例样本,漏检情况非常严重。模型可能根本没有学习到正例的有效特征,或者模型过于保守,将大量正例错误地判断为负例,需要对模型进行重新训练或调整,以提高其对正例的捕捉能力。

三、Accuracy(准确率)

3.1定义

定义:预测正确的样本数占总样本数的比例。计算公式为:
Accuracy= TP+TN/(TP+TN+FP+FN),其中TN(True Negative)表示真反例,即实际为负例且被预测为负例的样本数量。

3.2意义

意义:准确率是一个较为直观的指标,用于衡量模型整体的预测正确程度。但当数据集中正负样本比例不均衡时,准确率可能会产生误导。例如,在一个正负样本比例为 9:1 的数据集上,即使模型将所有样本都预测为正例,也能获得 90% 的准确率,但实际上模型并没有很好地学习到负例的特征。

3.3数值接近1

数值接近 1:表示模型整体的预测准确性很高,无论是正例还是负例,模型都能准确地进行分类。在数据分布较为均衡的情况下,准确率高说明模型对数据的拟合效果好,能够学习到数据中的有效特征,从而做出准确的预测。

3.4数值接近0.5左右

数值在 0.5 左右:说明模型的预测结果与随机猜测差不多,模型可能没有学习到数据中的任何有效信息,无法对样本进行准确分类。这可能是由于数据特征与目标变量之间没有明显的关联,或者模型过于简单,无法捕捉到数据中的复杂模式。

3.5数值接近0

数值接近 0:表示模型的预测结果几乎都是错误的,这是一种极端情况,通常是由于模型存在严重的问题,如模型结构错误、数据预处理不当、训练过程出现异常等,导致模型完全无法对数据进行正确的分类。

四、F1 值

4.1定义

定义:精确率和召回率的调和平均数,计算公式为:
F1= 2×Precision×Recall/(Precision+Recall)。

4.2意义

意义:F1 值综合了精确率和召回率两个指标,能够更全面地反映模型的性能。当精确率和召回率都较高时,F1 值也会较高。在实际应用中,F1 值常用于平衡精确率和召回率,特别是在两者之间存在权衡时,F1 值可以作为一个综合的评估指标来选择最优的模型。

4.3数值接近1

数值接近 1:说明模型在精确率和召回率上都表现出色,能够在准确识别正例的同时,尽可能地找出所有正例,模型的综合性能优秀。例如在信息检索系统中,F1 值接近 1 表示系统既能准确地返回相关的检索结果(精确率高),又能涵盖大部分相关的信息(召回率高),能够很好地满足用户的需求。

4.4数值0.5左右

数值在 0.5 左右:意味着模型在精确率和召回率之间存在一定的平衡,但整体性能一般。可能是精确率和召回率其中一个指标较高,而另一个指标较低,导致两者的调和平均数不高。此时需要分析具体是哪个指标拖了后腿,进而针对性地改进模型,以提高 F1 值。

4.5数值接近0

数值接近 0:表明模型在精确率和召回率方面的表现都很差,可能存在严重的分类错误或对正例的识别能力不足,模型需要进行全面的优化和调整,包括重新选择特征、调整模型结构、优化训练参数等,以提高精确率和召回率,进而提升 F1 值。

五、ROC 曲线与 AUC

5.1ROC曲线

ROC 曲线: Receiver Operating Characteristic 曲线,以假正率(FPR)为横坐标,真正率(TPR)为纵坐标绘制的曲线。其中
FPR= FP/(FP+TN),TPR= TP/(TP+FN)。ROC 曲线展示了模型在不同阈值下的分类性能,曲线越靠近左上角,说明模型的性能越好。

5.2AUC

AUC: Area Under the Curve,即 ROC 曲线下的面积。AUC 的值介于 0 到 1 之间,AUC 越大,说明模型的性能越好。AUC 为 1 表示模型能够完美地将正负样本区分开,AUC 为 0.5 表示模型的预测结果与随机猜测相当。

5.3AUC接近1

AUC 接近 1:说明 ROC 曲线靠近左上角,模型具有很强的区分正负样本的能力。在不同的阈值下,模型都能较好地将正例和负例区分开来,很少出现将正例误判为负例或负例误判为正例的情况,模型的性能非常优秀。
AUC 在 0.5 到 0.8 之间:表示模型具有一定的区分正负样本的能力,但性能一般。ROC 曲线位于对角线(AUC = 0.5)上方,说明模型的预测结果优于随机猜测,但还有较大的提升空间。可能需要进一步优化模型,调整特征或参数,以提高模型的性能。

5.4AUC接近0.5

AUC 接近 0.5:说明模型的区分能力与随机猜测相当,ROC 曲线接近对角线。这意味着模型可能没有学习到有效的特征来区分正负样本,需要重新审视数据和模型,查找问题所在,可能需要重新进行特征工程或选择更合适的模型。

5.5AUC小于0.5

AUC 小于 0.5:这种情况比较罕见,通常表示模型存在严重问题,其预测结果甚至不如随机猜测。可能是模型训练过程出现错误,或者数据存在严重的偏差或噪声,导致模型学到了错误的模式,需要对整个建模过程进行全面检查和修正。

六、平均绝对误差(MAE)

6.1定义

定义:预测值与真实值之间绝对误差的平均值。

6.2意义

意义:MAE 直观地反映了模型预测值与真实值之间的平均误差大小,其值越小,说明模型的预测结果越接近真实值,预测精度越高。

6.3数值接近0

数值接近 0:表示模型的预测值与真实值之间的平均差异非常小,模型能够准确地预测出目标值,预测精度很高。例如在预测股票价格走势时,MAE 接近 0 说明模型能够准确地预测出股票的实际价格,误差在可接受的范围内,模型具有很强的预测能力。

6.4数值较大

数值较大:说明模型的预测值与真实值之间存在较大的平均差异。例如在房价预测中,如果 MAE 较大,意味着模型预测的房价与实际房价有较大的偏差,可能是模型没有充分考虑到影响房价的各种因素,或者数据中存在一些异常值影响了模型的准确性,需要对模型进行改进或对数据进行进一步的处理。

七、均方误差(MSE)

7.1定义

定义:预测值与真实值之间误差平方的平均值。

7.2意义

意义:MSE 也用于衡量模型预测值与真实值之间的差异程度。由于对误差进行了平方运算,MSE 会对较大的误差给予更大的权重,因此对异常值更为敏感。MSE 越小,模型的性能越好。在一些优化问题中,常以最小化 MSE 为目标来训练模型。

7.3数值接近0

数值接近 0:表明模型的预测值与真实值之间的误差平方和很小,模型的预测效果非常好。与 MAE 类似,MSE 接近 0 表示模型能够准确地拟合数据,对目标值的预测精度高,在各种预测任务中都属于理想的状态。

7.4数值较大

数值较大:由于 MSE 对误差进行了平方运算,所以较大的 MSE 值说明模型存在较大的误差,而且对较大的误差给予了更大的权重。这可能是因为模型过于简单,无法捕捉到数据中的复杂关系,或者存在过拟合现象,导致在训练集上表现良好,但在测试集上误差较大。需要对模型进行调整,如增加模型的复杂度、采用正则化方法等,以降低 MSE 值,提高模型的性能。


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/43848.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

计算机网络——传输层(TCP)

传输层 在计算机网络中,传输层是将数据向上向下传输的一个重要的层面,其中传输层中有两个协议,TCP,UDP 这两个协议。 TCP 话不多说,我们直接来看协议报头。 源/目的端口号:表示数据从哪个进程来&#xff0…

【ArcGIS】ArcGIS10.6彻底卸载和ArcGIS10.2安装全过程

卸载python3后,解决了ArcGIS与python3冲突问题后,软件可以正常打开使用了 但是还是出现了问题 用ArcGIS 进行空间分析时,中间操作没有任何报错和问题,但是就是没有运行结果 在别人的软件上操作一遍可以出现运行结果 关闭确有这个,但真的不是我给它的运行时间不够,反反复复试…

智慧电力:点亮未来能源世界的钥匙

在科技日新月异的今天,电力行业正经历着前所未有的变革。智慧电力,作为这一变革的核心驱动力,正逐步改变着我们对电力的认知和使用方式。它不仅是电力行业的一次技术革新,更是推动社会可持续发展、实现能源高效利用的重要途径。 智…

oracle中java类的使用

方式一: 编写一个简单的java类 vi OracleJavaDemo.java public class OracleJavaDemo { public static String processData(String input) { return "Processed: " input; } } 编译 javac OracleJavaDemo.java 生成OracleJavaDemo…

pycharm2024.1.1版本_jihuo

目录 前置: 步骤: step one 下载软件 step two 卸载旧版本 1 卸载软件 2 清除残余 step three 下载补丁 step four 安装2024.1.1版本软件 step five 安装补丁 1 找位置放补丁 2 自动设置环境变量 step six 输入jihuo码 前置: 之…

革新汽车安全通信技术,美格智能全系车载通信模组支持NG-eCall

根据QYR(恒州博智)的统计及预测,2024年全球汽车无线紧急呼叫(eCall)设备市场销售额达到了25.17亿美元,预计2031年将达到44.97亿美元,年复合增长率(CAGR 2025-2031)为8.8%…

AWE 2025:当AI科技遇见智能家居

3月20日,以“AI科技、AI生活”为主题的AWE2025(中国家电及消费电子博览会)在上海新国际博览中心开幕。作为全球家电行业风向标,本届展会最大的亮点莫过于健康理念在家电领域的全面渗透。从食材保鲜到空气净化,从衣物清…

《Spring Cloud Eureka 高可用集群实战:从零构建高可靠性的微服务注册中心》

从零构建高可用 Eureka 集群 | Spring Cloud 微服务架构深度实践指南 本文核心内容基于《Spring Cloud 微服务架构开发》第1版整理,结合生产级实践经验优化 实验环境:IntelliJ IDEA 2024 | JDK 1.8| Spring Boot 2.1.7.RELEASE | Spring Cloud Greenwich…

蓝桥杯[每日一题] 真题:管道(java版)

题目描述 有一根长度为 len 的横向的管道,该管道按照单位长度分为 len 段,每一段的中央有一个可开关的阀门和一个检测水流的传感器。一开始管道是空的,位于 Li 的阀门会在 Si 时刻打开,并不断让水流入管道。 对于位于 Li 的阀门&a…

2.pycharm部署Ai - 编程好助手

一、pycharm安装continue插件 1.提前安装好pycharm,并双击打开 2.File – Setting 3.Plugins – 搜索Continue , 点击Install安装 4.点ok 二、获取硅基流动API 1.登入网站:https://siliconflow.cn/zh-cn/#/,并注册登入 2.获取AP…

《数据结构:单链表》

“希望就像星星,或许光芒微弱,但永不熄灭。” 博主的个人gitee:https://gitee.com/friend-a188881041351 一.概念与结构 链表是一种物理存储上非连续、非顺序的存储结构,数据元素的顺序逻辑是通过链表中的指针链接次序实现的。 单…

Visual Studio 2019 Qt QML 项目环境搭建常见问题处理方法

在 Visual Studio 2019 运行 Qt/QML 项目比直接使用QtCreator环境麻烦,主要是有qmake 的一些配置项不能在 Visual Studio中设置。下面整理一些常见问题的处理方法,供参考: 搭建VS Qt 环境,在Visual Studios 2019下面安装 Qt Vis…

基于Spring Boot的网上商城系统的设计与实现(LW+源码+讲解)

专注于大学生项目实战开发,讲解,毕业答疑辅导,欢迎高校老师/同行前辈交流合作✌。 技术范围:SpringBoot、Vue、SSM、HLMT、小程序、Jsp、PHP、Nodejs、Python、爬虫、数据可视化、安卓app、大数据、物联网、机器学习等设计与开发。 主要内容:…

如何监控和优化服务器的 CPU 性能

一、实时监控与诊断工具 1. 核心监控工具 bash 复制 # 实时CPU使用率监控 top -H -p <PID> # 按线程查看CPU占用 htop --sort-keyPERCENT_CPU # 可视化进程CPU排序 mpstat -P ALL 1 # 每核心使用率统计 2. 上下文切换分析 bash 复制 pidstat -w…

【蓝桥杯14天冲刺课题单】Day 1

1. 题目链接&#xff1a;19937 艺术与篮球 该题目的难点主要在20240413这个日期需要结束程序跳出循环。最开始将该输出ans的位置放在了for循环之外&#xff0c;此时的日期已经循环完了2024年所有的日期&#xff0c;则最后会统计多而导致结果错误。 AC代码&#xff1a; #incl…

Masked Attention 在 LLM 训练中的作用与原理

在大语言模型&#xff08;LLM&#xff09;训练过程中&#xff0c;Masked Attention&#xff08;掩码注意力&#xff09; 是一个关键机制&#xff0c;它决定了 模型如何在训练时只利用过去的信息&#xff0c;而不会看到未来的 token。这篇文章将帮助你理解 Masked Attention 的作…

Arduino、ESP32驱动GUVA-S12SD UV紫外线传感器(光照传感器篇)

目录 1、传感器特性 2、控制器和传感器连线图 3、驱动程序 UV紫外线传感器是一个测试紫外线总量的最佳传感器,它不需要使用波长滤波器,只对紫外线敏感。 Arduino UV紫外线传感器,直接输出对应紫外线指数(UV INDEX)的线性电压,输出电压范围大约0~1100mV(对应UV INDEX值…

基于微波光子信道的图像传输系统matlab仿真,调制方式采用OFDM+QPSK,LDPC编译码以及LS信道估计

目录 1.算法仿真效果 2.算法涉及理论知识概要 2.1 OFDMQPSK原理 2.2 微波光子信道简介 3.MATLAB核心程序 4.完整算法代码文件获得 1.算法仿真效果 matlab2022a仿真结果如下&#xff08;完整代码运行后无水印&#xff09;&#xff1a; 仿真操作步骤可参考程序配套的操作视…

【黑马点评】Redis解决集群的session共享问题

由于不同的tomcat服务器之间的session是不共享的&#xff0c;当请求如果在不同tomcat服务器之间切换就会导致数据丢失的问题。 使用redis可以解决session数据共享的问题 redis是tomcat以外的存储&#xff0c;存在redis中的数据&#xff0c;任何一台tomcat都能看得见&#xff0…

淘宝客户端动态化页面搭建

在手机淘宝等高频更新的业务场景中&#xff0c;UI页面的动态化和快速交付成为技术团队面临的重要挑战。本文围绕“客户端动态化页面搭建”这一主题&#xff0c;深入探讨了如何通过抽象框架设计解决高动态化页面的快速构建问题。文章详细介绍了框架的核心模块&#xff08;如Data…