机器学习基础-机器学习的常用学习方法

目录

半监督学习的概念

规则学习的概念

基本概念

机器学习里的规则

逻辑规则

规则集

充分性与必要性

冲突消解

命题逻辑 → 命题规则

序贯覆盖

单条规则学习

剪枝优化

强化学习的概念

1. 强化学习对应了四元组

2. 强化学习的目标

强化学习常用马尔可夫决策过程 (MDP) 描述

1. 机器所处的环境 F

2. 状态空间 X

3. 机器能采取的行为空间 A

4. 策略 (policy) π

5. 潜在的状态转移 (概率) 函数 P

6. 潜在的奖赏 (reward) 函数 R

强化学习vs监督学习


半监督学习的概念

少量有标签样本和大量有标签样本进行学习;这种方法旨在利用未标注数据中的结构信息来提高模型性能,尤其是在标注数据获取成本高昂或困难的情况下。


规则学习的概念

规则学习(Rule Learning)是一种机器学习方法,它旨在从数据中自动发现和提取出能够描述数据模式的规则。这些规则通常是人类可读的,并且可以用来进行预测、分类或解释数据。规则学习的目标是找到一组简洁而有效的规则,使得这些规则能够在新的、未见过的数据上做出准确的决策。

基本概念

机器学习里的规则

        若......则......

  • 解释:如果预测函数 h^(x) 的输出等于某个值 y^​,则实际输出 y 也应为 y

  • 解释:如果预测函数 h(x) 的输出大于0,则样本属于正类(class = 1);否则属于负类(class = -1)。

  • 解释:如果样本 x 到中心点 ci​ 的距离小于到其他所有中心点的距离,则样本 x 被分配到簇 ci。

逻辑规则

规则集

  • 如果西瓜的根蒂是缩缩的且肚脐是凹陷的,则该西瓜是好瓜。
  • 如果西瓜的纹理是模糊的,则该西瓜不是好瓜。

充分性与必要性

  • 充分性: 如果条件满足,则结论必然成立。
  • 必要性: 如果结论成立,则条件必须满足。

冲突消解

  • 顺序规则: 按照规则的顺序进行匹配和应用。
  • 缺省规则: 在没有明确规则的情况下使用默认规则。
  • 元规则: 用于处理规则之间的冲突或优先级问题。

命题逻辑 → 命题规则

  • 原子命题:

        用大写字母表示,如 A,B,C,…
  • 逻辑连词:

        包括:←,→,↔,∧,∨,¬,…
        eg:
    • 好瓜←(根蒂=蜷缩)∧(脐部=凹陷)

      这个规则可以读作:“如果西瓜的根蒂是蜷缩的且脐部是凹陷的,则该西瓜是好瓜。”
       

序贯覆盖

  • 主要一个生成规则集的机器学习算法,主要用于分类任务。
  • 在训练集上每学到一条规则,就将该规则覆盖的样例去除,然后以剩下的样例组成训练集重复上述过程(分治策略)

单条规则学习

  • 目标:寻找一组最优的逻辑文字来构成规则体
  • 本质:搜索问题
  • 方法:
    • 自顶向下:一般到特殊(特化)
      eg:初始时假设“所有西瓜都是好瓜”,然后逐步增加条件,如“根蒂蜷缩且脐部凹陷”,以更精确地定义哪些西瓜是好瓜。



    • 自底向上:特殊到一般(泛化)

剪枝优化

  • 预剪枝
    • 使用似然率统计量 (LRS) 来评估规则的有效性,并在规则生成过程中进行剪枝。
    • 目的是减少过拟合,提高模型的泛化能力。
  • 后剪枝
    • 在规则生成完成后,通过穷举所有可能的剪枝操作来优化规则集。
    • 减错剪枝(REP)
      • 用验证集反复剪枝直到准确率无法提高
      • 穷举所有可能的剪枝操作(删除文字,删除规则),复杂度非常高
  • 两者结合
    • IREP:每生成一条新规则即对其进行REP剪枝
    • IREP*:对IREP的改进
    • RIPPER:具体过程如下

① 用IREP*生成规则集,但发现规则覆盖了两个负样本

② 选取该规则,找到其覆盖的样例,之后重新生成规则

③ 特化原规则后再泛化

④ 把新规则和原规则分别置入规则集进行评价,留下最好的

④ 反复优化直到无法进步


强化学习的概念

强化学习(Reinforcement Learning, RL)是机器学习的一个分支,它关注的是如何基于环境所给予的奖励或惩罚信号来采取行动,以实现某种长期目标。在强化学习中,智能体(Agent)通过与环境(Environment)交互来进行学习,其目的是找到一种策略(Policy),使得累积的奖励最大化。

1. 强化学习对应了四元组

E=<X,A,P,R>

  • X: 状态空间,表示智能体感知到的环境状态。
  • A: 动作空间,表示智能体可以采取的动作。
  • P: 状态转移概率函数,表示在给定当前状态 xx 和动作 aa 下转移到下一个状态 x′x′ 的概率。
  • R: 奖赏函数,表示在给定当前状态 xx 和动作 aa 下获得的即时奖赏。
2. 强化学习的目标
  • 目标: 机器通过在环境中不断尝试从而学到一个策略 π,使得长期执行该策略后得到的累积奖赏最大。

强化学习常用马尔可夫决策过程 (MDP) 描述

1. 机器所处的环境 F
  • 描述: 机器所处的环境。
  • 示例: 在种西瓜任务中,环境是西瓜生长的自然世界。
2. 状态空间 X
  • 定义: x∈X 是机器感知到的环境的描述。
  • 示例: 瓜苗长势的描述。
3. 机器能采取的行为空间 A
  • 定义: 机器能采取的行为集合。
  • 示例: 浇水、施肥等。
4. 策略 (policy) π
  • 定义: π:X→A (或 π:X×A→R)
    • 策略 π 是一个从状态空间 X 到行为空间 A 的映射,表示在给定状态下智能体应采取的动作。
  • 示例: 根据瓜苗状态是缺水时,返回动作浇水。
5. 潜在的状态转移 (概率) 函数 P
  • 定义: P:X×A×X→R
    • P 描述了在给定当前状态 x 和采取动作 a 后,转移到下一个状态 x′ 的概率。
  • 示例: 瓜苗当前状态缺水,选择动作浇水,有一定概率恢复健康,也有一定概率无法恢复。
6. 潜在的奖赏 (reward) 函数 R
  • 定义: R:X×A×X→R 或 R:X×X→R
    • 表示在状态 x 下采取动作 a 并转移到状态 x′ 时获得的奖赏。
  • 示例: 瓜苗健康对应奖赏 +1,瓜苗凋零对应奖赏 -10。

强化学习vs监督学习

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/504176.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Qt QDockWidget详解以及例程

Qt QDockWidget详解以及例程 引言一、基本用法二、深入了解2.1 窗口功能相关2.2 停靠区域限制2.3 在主窗体布局 引言 QDockWidget类提供了一个可以停靠在QMainWindow内的小窗口 (理论上可以在QMainWindow中任意排列)&#xff0c;也可以作为QMainWindow上的顶级窗口浮动 (类似一…

【设计模式-2】23 种设计模式的分类和功能

在软件工程领域&#xff0c;设计模式是解决常见设计问题的经典方案。1994 年&#xff0c;Erich Gamma、Richard Helm、Ralph Johnson 和 John Vlissides&#xff08;四人帮&#xff0c;GoF&#xff09;在《设计模式&#xff1a;可复用面向对象软件的基础》一书中系统性地总结了…

【Linux 之 二十 】使用 ln 命令创建符号链接

ln&#xff08;英文全拼&#xff1a;link files&#xff09;是Linux中非常重要的一个命令&#xff0c;用创建一个硬链接或者一个符号链接&#xff08;也叫软链接&#xff09;。它的功能是为某一个文件或目录在另外一个位置建立一个同步的链接。当我们需要在多个目录下都能显示某…

B树及其Java实现详解

文章目录 B树及其Java实现详解一、引言二、B树的结构与性质1、节点结构2、性质 三、B树的操作1、插入操作1.1、插入过程 2、删除操作2.1、删除过程 3、搜索操作 四、B树的Java实现1、节点类实现2、B树类实现 五、使用示例六、总结 B树及其Java实现详解 一、引言 B树是一种多路…

Nature Electronics——近传感器计算:50 nm异构集成技术的革命

创新点&#xff1a;1.高密度互联设计&#xff1a;基于二维材料&#xff0c;开发出互连密度高达62,500 I/O每平方毫米的M3D集成结构。2.异构层堆叠&#xff1a;整合了第二层石墨烯化学传感器和第一层MoS₂记忆晶体管&#xff0c;实现功能互补。3.超短传感器与计算元件距离&#…

如何用 ESP32-CAM 做一个实时视频流服务器

文章目录 ESP32-CAM 概述ESP32-S 处理器内存Camera 模块MicroSD 卡槽天线板载 LED 和闪光灯其他数据手册和原理图ESP32-CAM 功耗 ESP32-CAM 引脚参考引脚排列GPIO 引脚哪些 GPIO 可以安全使用&#xff1f;GPIO 0 引脚MicroSD 卡引脚 ESP32-CAM 的烧录方式使用 ESP32-CAM-MB 编程…

江科大STM32入门——IIC通信笔记总结

wx&#xff1a;嵌入式工程师成长日记 &#xff08;一&#xff09;简介 STM32内部集成了硬件I2C收发电路&#xff0c;可以由硬件自动执行时钟生成、起始终止条件生成、应答位收发、数据收发等功能&#xff0c;减轻CPU的负担 支持多主机 支持7位/10位地址模式 支持不同的通讯速…

vue2日历组件

这个代码可以直接运行&#xff0c;未防止有组件库没安装&#xff0c;将组件库的代码&#xff0c;转成文字了 vue页面 <template><div class"about"><div style"height: 450px; width: 400px"><div style"height: 100%; overflo…

Java语法总结

Java的数据类型分为基本数据类型和引用数据类型。 1.基本数据类型&#xff1a;四类八种 byte 和short 比较特殊&#xff0c;不必考虑int类型&#xff0c;只关注是否超出了表示范围。 数据超出了int的范围&#xff0c;改正&#xff1a;在后边添加L &#xff0c;定义变量报错…

自动驾驶控制与规划——Project 6: A* Route Planning

目录 零、任务介绍一、算法原理1.1 A* Algorithm1.2 启发函数 二、代码实现三、结果分析四、效果展示4.1 Dijkstra距离4.2 Manhatten距离4.3 欧几里德距离4.4 对角距离 五、后记 零、任务介绍 carla-ros-bridge/src/ros-bridge/carla_shenlan_projects/carla_shenlan_a_star_p…

闲谭SpringBoot--ShardingSphere分库分表探究

文章目录 1. 背景2. 创建数据库3. 修改yml配置文件4. 分片算法类5. 测试6 小结 1. 背景 接上文&#xff0c;我们对日志表&#xff0c;进行了按月的分表&#xff0c;这样每个月几百万条数据量还是扛得住的。 但是如果数据再多呢&#xff0c;除了提高硬件性能&#xff0c;还有一…

IT面试求职系列主题-Jenkins

想成功求职&#xff0c;必要的IT技能一样不能少&#xff0c;先说说Jenkins的必会知识吧。 1) 什么是Jenkins Jenkins 是一个用 Java 编写的开源持续集成工具。它跟踪版本控制系统&#xff0c;并在发生更改时启动和监视构建系统。 2&#xff09;Maven、Ant和Jenkins有什么区别…

STM32供电参考设计

STM32供电参考设计 ​ 在图中有VDD&#xff0c;VSS和VDDA&#xff0c;VSSA两种类型的供电引脚&#xff0c;其数据手册解释如下&#xff1a; ​ 令我不解的是&#xff1a;VDDA和VSSA必须分别连接到VDD和VSS&#xff0c;这是什么意思&#xff1f;有大佬能够解答一下吗&#xff1f…

和为0的四元组-蛮力枚举(C语言实现)

目录 一、问题描述 二、蛮力枚举思路 1.初始化&#xff1a; 2.遍历所有可能的四元组&#xff1a; 3.检查和&#xff1a; 4.避免重复&#xff1a; 5.更新计数器&#xff1a; 三、代码实现 四、运行结果 五、 算法复杂度分析 一、问题描述 给定一个整数数组 nums&…

嵌入式系统 (2.嵌入式硬件系统基础)

2.嵌入式硬件系统基础 2.1嵌入式硬件系统的组成 嵌入式硬件系统以嵌入式微处理器为核心&#xff0c;主要由嵌入式微处理器、总线、存储器、输入/输出接口和设备组成。 嵌入式微处理器 嵌入式微处理器采用冯诺依曼结构或哈佛结构&#xff1a;前者指令和数据共享同一存储空间…

对快速由表及里说拜拜/如何正确运用由表及里

你是不是还&#xff1a;看到一男子拖走一女子就以为小情侣吵架而已&#xff08;可能人贩子&#xff09;&#xff1b;看到男友对你好个几次就从此死心塌地&#xff08;可能有手就行&#xff0c;细节装装而已&#xff09;结果耽误终身&#xff1b;看到女同事对你微笑不排斥就以为…

(七)人工智能进阶之人脸识别:从刷脸支付到智能安防的奥秘,小白都可以入手的MTCNN+Arcface网络

零、开篇趣谈 还记得第一次用支付宝"刷脸"时的新奇感吗&#xff1f;或者被抖音的人脸特效逗乐的瞬间&#xff1f;这些有趣的应用背后&#xff0c;其实藏着一个精妙的AI世界。今天&#xff0c;就让我们开启一段奇妙的人脸识别技术探索之旅吧&#xff01; 一、人脸识…

腾讯云AI代码助手编程挑战赛-图片转换工具

作品简介&#xff1a; 解决了人们学习生活中的图片格式转换问题&#xff0c; 制作该脚本&#xff0c;省去了打开在线编辑器操作的时间&#xff0c; 免费为用户提供图片格式的转换的实用小工具 技术架构 python语言的tk库来完成的GUI页面设计&#xff0c; 引用PIL包转换图…

【VUE 指令学习笔记】

v-bind :单向绑定解析表达式&#xff0c;可简写为:xxx v-model :双向数据绑定。 v-for&#xff1a;遍历数组/对象/字符串 v-on&#xff1a;绑定事件监听&#xff0c;可简写为。 v-if:条件渲染(动态控制节点是否存存在) v-else:条件渲染(动态控制节点是否存存在) v-show:条件渲染…

高山旅游景区有效降低成本,无人机山下到山上物资吊运技术详解

在高山旅游景区&#xff0c;传统的物资运输方式往往面临人力成本高昂、效率低下等问题&#xff0c;而无人机技术的引入为这一难题提供了新的解决方案。以下是对无人机从山下到山上进行物资吊运技术的详细解析&#xff1a; 一、无人机物资吊运技术的优势 1. 降低人力成本&#…