机器学习(2)

目录

2-1泛化能力

2-2过拟合和欠拟合

2-3三大问题

2-4评估方法

2-5调参和验证集

2-6性能度量

2-7比较检验


2-1泛化能力

如何进行模型评估与选择?

2-2过拟合和欠拟合

泛化误差:在“未来”样本上的误差

经验误差:在训练集上的误差,亦称“训练误差”‘

过拟合:把训练样本自身的一些特点当成了所有潜在样本都会具有的一般性质

欠拟合:对训练样本的一般性质尚未学好

在使用算法时问自己两个问题:

1.该算法如何解决overfitting?

2.在什么时候解决overfitting会失效?

2-3三大问题

三个关键问题:

如何获得测试结果?——>评估方法

如何评估性能评估?——>性能度量

如何判断实质差别?——>比较检验

2-4评估方法

关键:怎么获得“测试集”?

测试集应该与训练集互斥

常见方法:留出法;交叉验证法;自助法

留出法:

拥有的数据集一部分用于训练,一部分用于测试

k-交叉验证法:

若k=m,则得到“留一法”

自助法:

2-5调参和验证集

算法的参数:一般由人工设定,亦称“超参数”

模型的参数:一般由学习确定

区别:训练集vs测试集vs验证集

其实验证集就是训练集的一部分,只是训练集中一部分用于训练,留出一部分用于调参数,亦称为验证集

2-6性能度量

性能度量是衡量模型泛化能力的评价标准,反映了任务需求

使用不同的任务度量往往会导致不同的评判结果

什么模型是“好”的,不取决于算法和数据,还取决于任务需求

错误率:分类错误的样本数占样本总数的比例

精度:分类正确的样本数占样本总数的比例

TP:模型预测为真,实际为真

FN:模型预测为假,实际为真

FP:模型预测为真,实际为假

TN:模型预测为假,实际为假

一般来说,查准率和查全率是一对矛盾的度量

F1是基于查准率和查全率的调和平均定义的

在一些应用中对查准率和查全率的重视程度有所不同,例如在商品推荐系统中,更希望推荐的是用户感兴趣的内容,此时查准率比较重要;而在逃犯检索系统中,更希望抓到所有逃犯,因此,查全率更为重要。

2-7比较检验

有了实验评估方法和性能度量,看起来就能对学习器的性能进行评估比较了。但实际上机器学习中性能比较这件事比大家想的复杂得多。

统计假设检验为我们进行学习器性能比较提供了重要依据。基于假设检验结果我们可以推断出,若在测试集上观察到学习器A比B好,则A的泛化性能是否在统计意义上优于B,以及这个结论的把握有多大。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/326894.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Elastic 将于 2024 年 5 月 25 日在上海举行线下 Meetup

2024 Elastic Meetup 上海站活动,由 Elastic、悦高软件、新智锦绣联合举办,现诚邀广大技术爱好者及开发者参加。 活动时间 2024 年 5 月 25 日 13:30-18:00 活动地点 中国上海 上海市黄浦区北京东路668号科技京城G座7楼 活动流程 13:30-14:00 入场 14…

设计一个游戏的基本博弈框架

设计一个游戏的基本博弈框架,玩家通过操作改变某个数值,这个数值的变动会引发一系列实时变化,并且当这些数值累计到特定阈值时,会导致游戏中出现其他变化,可以分为以下几个步骤: 1. 确定游戏类型和主题 首…

从零创建一个vue2项目

标题从零创建一个vue2项目,项目中使用TensorFlow.js识别手写文字 npm切换到淘宝镜像 npm config set registry https://registry.npm.taobao.org安装vue/cli -g npm install -g vue/cli检查是否安装成功 vue -V创建项目 vue create 项目名安装TensorFlow npm …

1689 ssm社区老人危机干预系统myeclipse开发mysql数据库springMVC模式java编程计算机网页设计

一、源码特点 java ssm社区老人危机干预系统是一套完善的web设计系统(系统采用SSM框架进行设计开发,springspringMVCmybatis),对理解JSP java编程开发语言有帮助,系统具有完整的源代码和数据库,系统主…

为什么很多计算机专业的同学毕业即失业❓

✅大部分计算机专业毕业生在就业时遇到困难,原因往往是多方面的,并非普遍情况,主要包括以下几点: 1.技能不匹配:学校所学知识可能与实际工作需求有一定差距,比如缺乏特定编程语言的深入掌握或实际项目经验。…

【Docker】docker 镜像如何push到私有docker仓库

文章目录 一、 网址解析对于Linux和macOS系统:对于Windows系统: 二、 镜像push 一、 网址解析 希望 registry.meizu.com 能够解析到内网IP地址(例如10.128.17.157),您可以通过修改主机的 hosts 文件来实现。 hosts 文…

【机器学习】机器学习与人工智能融合新篇章:自适应智能代理在多元化复杂环境中的创新应用与演进趋势

🔒文章目录: 💥1.引言 🚋1.1 机器学习与人工智能的发展背景 🚌1.2 自适应智能代理的概念与重要性 🚐1.3 研究目的与意义 ☔2.自适应智能代理的关键技术 🛣️2.1 环境感知与信息处理技术 …

【网络知识】光猫、路由器 和 交换机 的作用和区别?

1.光猫如下: 光猫:将光纤的光信号转换为数字信号。 2.路由器如下: 路由器上的 WAN 口 是黄色,用于连接外部网络,比如:光猫出来的线。 黄色隔壁三个白灰色接口为LAN口,负责内网,比如…

C# WinForm —— 14 CheckedListBox 复选列表框介绍

1. 简介 类似 ListBox,提供项的列表,区别就是 CheckedListBox 每一个项前面有个复选框 2. 常用属性 属性解释(Name)控件ID,在代码里引用的时候会用到,一般以 ckl 开头BackColor背景颜色BoderStyle边框样式:无、FixedSingle、F…

SqlServer2016安装

1、下载 下载地址: https://www.microsoft.com/en-us/server-cloud/products/sql-server-2016/ 或者 MSDN, 我告诉你 - 做一个安静的工具站 开发版下载地址:https://myprodscussu1.app.vssubscriptions.visualstudio.com/downloads KB2919442下载地址…

Centos7 配置 DNS服务器

Centos 7 配置DNS服务器 环境描述: 一台服务器和一台用于测试的客户机 服务器IP:192.168.200.132 客户机IP:192.168.200.143 服务器配置 yum install bind bind-utils -y #安装软件包vim /etc/named.conf //编辑named主配置文件listen-on p…

【云原生】Kubeadm搭建K8S

一、部署Kubernetes 实验环境 服务器主机名IP地址主要组件k8s集群master01 etcd01master01192.168.10.100kube-apiserver kube-controller-manager kube-schedular etcdk8s集群node01 etcd02node01192.168.10.101kubelet kube-proxy docker flannelk8s集群node02 etcd03nod…

uniapp编译H5解决ios的border-radius失效问题,以及ios满屏显示不全的问题

1.解决方案 .card-itemA {width: 650rpx;height: 326rpx;box-shadow: 0rpx 0rpx 30rpx 14rpx rgba(236, 235, 236, 0.25);background: linear-gradient(180deg, #FFFFFF 0%, rgba(255, 255, 255, 0) 100%);border-radius: 60rpx;overflow: hidden;// 兼容ios的圆角问题transfor…

免费思维13招之十:增值型思维

免费思维13招之十:增值型思维 免费思维的另一大战略思维——增值型思维。 为了提高客户的粘性而促进重复性消费,我们必须对客户进行免费的增值型服务。 大家不要把增值型思维与赠品型思维混淆,增值型思维重心在于提高与消费者的粘性而促进重复消费,重心在后端。而赠品型思…

基于C#开发web网页管理系统模板流程-登录界面

前言,首先介绍一下本项目将要实现的功能 (一)登录界面 实现一个不算特别美观的登录窗口,当然这一步跟开发者本身的设计美学相关,像蒟蒻博主就没啥艺术细胞,勉强能用能看就行…… (二&#xff09…

FOTS:一种用于机器人操作技能Sim2Real学习的快速光学触觉仿真器

类 GelSight的视触觉传感器具有高分辨率和低制造成本的优势,但是在与现实中的物体进行频繁接触时易受磨损。而触觉仿真器可大幅降低硬件成本,同时为后续技能学习任务提供仿真训练环境。为此,来自东南大学自动化学院的钱堃副教授研究团队和伦敦…

vue3+ts--实际开发之--table表格打印或者保存

vue3实现指定区域打印(导出)功能-主要是解决分页内容分割问题 一、 问题页面效果二、 Print.js相关属性 和使用1. 介绍2. 安装引入3. PrintJS参数配置表 三 、解决关于分页文字或者表格被分割问题,解决后如下:1. 设置一个自定义ta…

windows 环境下安装《车辆动态监控系统》支持JT808、JT1078、苏标主动安全设备接入

《车辆动态监控系统》下载安装部署包 开放端口 80/443/8800,web后台端口,nginx代理服务,nginx默认为8800端口8808,JT808专用端口6802,视频播放推流端口6891-6898,FTP端口6821,苏标主动安全附件…

OpenAI放大招:不是GPT-5和搜索引擎,或推AI助理?

近日,关于 ChatGPT 的开发公司 OpenAI 将推出与谷歌搜索竞争的产品的传闻甚嚣尘上。有报道指出,OpenAI 计划增强 ChatGPT 的功能,并进军搜索引擎市场,新产品甚至可能在 5 月 13 日谷歌 I/O 大会的前一天发布。 然而,Op…

java-spring 09 下.populateBean (方法成员变量的注入@Autowird,@Resource)

1.在populateBean 方法中的一部分:用于Autowird,Resource注入 // 后处理器已经初始化boolean hasInstAwareBpps hasInstantiationAwareBeanPostProcessors();// 需要依赖检查boolean needsDepCheck (mbd.getDependencyCheck() ! AbstractBeanDefinitio…