sheng的学习笔记-AI-规则学习(rule learning)

 AI目录:sheng的学习笔记-AI目录-CSDN博客

什么是规则学习

机器学习中的“规则”(rule)通常是指语义明确、能描述数据分布所隐含的客观规律或领域概念、可写成“若……,则……”形式的逻辑规则。​“规则学习”(rule learning)是从训练数据中学习出一组能用于对未见示例进行判别的规则。

一条规则形如:

在数理逻辑中“文字”专指原子公式(atom)及其否定。

与神经网络、支持向量机这样的“黑箱模型”相比,规则学习具有更好的可解释性,能使用户更直观地对判别过程有所了解。另一方面,数理逻辑具有极强的表达能力,绝大多数人类知识都能通过数理逻辑进行简洁的刻画和表达。例如“父亲的父亲是爷爷”这样的知识不易用函数式描述,而用一阶逻辑则可方便地写为“爷爷(X,Y)←父亲(X,Z)∧父亲(Z,Y)”​,因此,规则学习能更自然地在学习过程中引入领域知识。此外,逻辑规则的抽象描述能力在处理一些高度复杂的AI任务时具有显著的优势,例如在问答系统中有时可能遇到非常多、甚至无穷种可能的答案,此时若能基于逻辑规则进行抽象表述或者推理,则将带来极大的便利。

假定我们从西瓜数据集学得规则集合ℛ:

规则1:好瓜←(根蒂=蜷缩)∧(脐部=凹陷)​;

规则2:¬好瓜←(纹理=模糊)​。

规则1的长度为2,它通过判断两个逻辑文字的赋值(valuation)来对示例进行判别。符合该规则的样本(例如西瓜数据集2.0中的样本1)称为被该规则“覆盖”(cover)。需注意的是,被规则1覆盖的样本是好瓜,但没被规则1覆盖的未必不是好瓜;只有被规则2这样以“¬好瓜”为头的规则覆盖的才不是好瓜。

规则冲突

规则集合中的每条规则都可看作一个子模型,规则集合是这些子模型的一个集成。

当同一个示例被判别结果不同的多条规则覆盖时,称发生了“冲突”(conflict),解决冲突的办法称为“冲突消解”(conflict resolution)。

常用的冲突消解策略有投票法、排序法、元规则法等。

  • 投票法是将判别相同的规则数最多的结果作为最终结果。
  • 排序法是在规则集合上定义一个顺序,在发生冲突时使用排序最前的规则;相应的规则学习过程称为“带序规则”(ordered rule)学习或“优先级规则”(priority rule)学习。
  • 元规则法是根据领域知识事先设定一些“元规则”(meta-rule),即关于规则的规则,例如“发生冲突时使用长度最小的规则”​,然后根据元规则的指导来使用规则集。

默认规则

从训练集学得的规则集合也许不能覆盖所有可能的未见示例,

例如前述规则集合ℛ无法对“根蒂=蜷缩”​、​“脐部=稍凹”且“纹理=清晰”的示例进行判别;这种情况在属性数目很多时常出现。

因此,规则学习算法通常会设置一条“默认规则”(default rule),由它来处理规则集合未覆盖的样本;例如为ℛ增加一条默认规则:​“未被规则1,2覆盖的都不是好瓜”​。

命题规则”(propositional rule)和“一阶规则”(first-order rule)

规则1:好瓜(X)←根蒂(X,蜷缩)∧脐部(X,凹陷)​;

规则2:¬好瓜(X)←纹理(X,模糊)​。

命题规则是一阶规则的特例,因此一阶规则的学习比命题规则要复杂得多。

一阶规则

受限于命题逻辑表达能力,命题规则学习难以处理对象之间的“关系”(relation),而关系信息在很多任务中非常重要。

例如,我们在现实世界挑选西瓜时,通常很难把水果摊上所有西瓜的特征用属性值描述出来,因为我们很难判断:色泽看起来多深才叫“色泽青绿”​?敲起来声音多低才叫“敲声沉闷”​?

比较现实的做法是将西瓜进行相互比较,例如,​“瓜1的颜色比瓜2更深,并且瓜1的根蒂比瓜2更蜷”​,因此“瓜1比瓜2更好”​。这超越了命题逻辑的表达能力,需用一阶逻辑表示,并且要使用一阶规则学习。

定义:

色泽深度:乌黑﹥青绿﹥浅白;

根蒂蜷度:蜷缩﹥稍蜷﹥硬挺;

敲声沉度:沉闷﹥浊响﹥清脆;

纹理清晰度:清晰﹥稍糊﹥模糊;

脐部凹陷度:凹陷﹥稍凹﹥平坦;

触感硬度:硬滑﹥软粘。

括号内数字对应于(4.3 剪枝处理 表4.2 西瓜数据集2.0划分出的训练集与验证集)中的样例编号。

分隔线上半部分为背景知识,下半部分为样例。

西瓜数据集2.0训练集就转化为表15.1的西瓜数据集5.0.这样的数据直接描述了样例间的关系,称为“关系数据”(relational data),其中由原样本属性转化而来的“色泽更深”​“根蒂更蜷”等原子公式称为“背景知识”(background knowledge),而由样本类别转化而来的关于“更好”​“¬更好”的原子公式称为关系数据样例(examples)。

一阶逻辑子句:(∀X,∀Y)(更好(X,Y)←根蒂更蜷(X,Y)∧脐部更凹(X,Y))​

一阶规则仍是式(15.1)的形式,但其规则头、规则体都是一阶逻辑表达式,

​“更好(·,·)”​、​“根蒂更蜷(·,·)”​、​“脐部更凹(·,·)”是关系描述所对应的谓词,个体对象“瓜1”​、​“瓜2”被逻辑变量“X”​、​“Y”替换。全称量词“∀”表示该规则对所有个体对象都成立;

一阶规则学习能容易地引入领域知识,这是它相对于命题规则学习的另一大优势。在命题规则学习乃至一般的统计学习中,若欲引入领域知识,通常有两种做法:

  • 在现有属性的基础上基于领域知识构造出新属性,
  • 或基于领域知识设计某种函数机制(例如正则化)来对假设空间加以约束。

现实任务中并非所有的领域知识都能容易地通过属性重构和函数约束来表达。

例如,假定获得了包含某未知元素的化合物X,欲通过试验来发现它与已知化合物Y的反应方程式。我们可多次重复试验,测出每次结果中化合物的组分含量。虽然我们对反应中的未知元素性质一无所知,但知道一些普遍成立的化学原理,例如金属原子一般产生离子键、氢原子之间一般都是共价键等,并且也了解已知元素间可能发生的反应。有了这些领域知识,重复几次试验后就不难学出X和Y的反应方程式,还可能推测出Y的性质、甚至发现新的分子和元素。类似这样的领域知识充斥在日常生活与各类任务中,但在基于命题表示的学习中加以利用却非常困难。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/423520.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Lua发邮件:实现自动化邮件发送教程指南!

Lua发邮件高级技巧有哪些?如何利用Lua发送电子邮件? 自动化邮件发送是一个非常实用的功能,广泛应用于各种场景,如通知、提醒、报告生成等。Lua作为一种轻量级脚本语言,因其简洁和高效而受到广泛欢迎。AokSend将详细介…

OpenCV class2-C#+winfrom显示控件使用窗口大小并内存管理

一.控件效果说明 二.代码声明(已经循环读取10000次) 全局 OpenCvSharp.Point point new OpenCvSharp.Point(0, 0); OpenCvSharp.Size size2; Mat src new Mat(); 初始化 size2 new OpenCvSharp.Size(pictureBox1.Size.Width, pictureBox1.Size.Hei…

PHP智驭未来悦享生活智慧小区物业管理小程序系统源码

智驭未来,悦享生活 —— 探索智慧小区物业管理小程序 一、引言:智慧生活的新篇章 在这个日新月异的时代,科技正以前所未有的速度改变着我们的生活。从智能家居到智慧城市,每一处都闪耀着智慧的光芒。而今天,我要带大家…

elementui Cascader 级联选择器的使用总结

实现效果 技术要点总结如下: 1、点击添加自动增加多行,实现自主选择增加多条节点数据 2、节点地址使用的是Cascader 级联选择器,需要动态生成,涉及到一个技术要点是:因v-modal只能获取value不能获取label,故…

汇编实现从1加到1000(《X86汇编语言 从实模式到保护模式(第2版》) 第135页第2题解答)

题目: 编写一段主引导扇区程序,计算从1加到1000的和,并在屏幕上显示结果 输出结果: 代码: jmp near start text db 123...1000 start:mov ax,0x07c0mov ds,ax ;数据段从主引导区开始mov ax,0xb800mov es,ax ;显存地址从B8000物理地址开始mov si,text ;si指向text的第…

极狐GitLab 新一代容器镜像仓库正式上线啦!

从极狐GitLab 17.3 开始,私有化部署实例也可以使用新一代容器镜像仓库啦!新一代容器镜像仓库具有更高效的零宕机垃圾收集功能和其他优势。 从去年开始,极狐GitLab 就启动了重构容器镜像仓库的计划,用以构建具有更强功能的镜像仓库…

什么是测试驱动开发?

测试驱动开发(Test-Driven Development,简称TDD)是一种软件开发方法,它强调在编写功能代码之前,先编写测试代码。这种方法的核心思想是通过测试来推动整个开发过程的进行,确保代码的质量和可维护性。 一、基…

Hibernate QueryPlanCache 查询计划缓存引发的内存溢出

目录 1.排查方式2.结论3.解决办法 前言:在生产环境中有一个后端程序多次报oom然后导致程序中断。 1.排查方式 通过下载后端程序产生的oom文件,将oom文件导入MemoryAnalyzer程序分析程序堆内存使用情况。 1、将oom文件导入MemoryAnalyzer后可以看到概览信…

玩转扩展库,温湿度传感器篇!—合宙Air201资产定位模组LuatOS快速入门05

随着LuatOS快速入门系列教程的推出,小伙伴们学习热情高涨。 合宙Air201不仅支持三种定位方式,还具有丰富的扩展功能,通过外扩BTB链接方案,最多可支持21个IO接口:SPI、I2C、UART等多种接口全部支持。 本期&#xff0c…

uniapp小程序富文本编辑器 简单不需要下载插件 复制代码直接复用

题外话:富文本编辑器搞了好久,下载好几个插件,都没成功,最后复制这篇文章的代码,我又修改了一点东西,就成功了:(买下面的css文件还花了2块钱,现在我免费给大家&#xff0…

STM32常用数据采集滤波算法

例如,STM32进行滤波处理时,主要目的是处理数据采集过程中可能产生的噪声和尖刺信号。这些噪声可能来自电源干扰、传感器自身的不稳定性或其他外部因素。 1.一阶互补滤波 方法:取a0~1,本次滤波结果(1-a)本次采样值a上…

[开源]YOLOv8+Pyside6的交通红绿灯目标检测源码

[开源]YOLOv8Pyside6的交通红绿灯目标检测源码 一. 项目介绍源码链接 该系统是yolov8目标检测可视化界面检测系统,支持图片、视频、摄像头检测. 系统的模型是自己训练的模型, 源码自取 源码链接 如需自己训练模型, 数据集链接 二. 作者的运行环境 python3.8tor…

828华为云征文|华为云Flexus X实例docker部署mediacms,功能齐全的现代化开源视频和媒体CMS

828华为云征文|华为云Flexus X实例docker部署mediacms,功能齐全的现代化开源视频和媒体CMS 华为云最近正在举办828 B2B企业节,Flexus X实例的促销力度非常大,特别适合那些对算力性能有高要求的小伙伴。如果你有自建MySQL、Redis、…

【专题】2024年8月医药行业报告合集汇总PDF分享(附原数据表)

原文链接:https://tecdat.cn/?p37621 在科技飞速发展的当今时代,医药行业作为关乎人类生命健康的重要领域,正处于前所未有的变革浪潮之中。数智医疗服务的崛起,为医疗模式带来了全新的转变,开启了医疗服务的新时代。…

git如何灵活切换本地账号对应远程github的两个账号

git如何灵活切换本地账号对应远程github的两个账号 问题: 有时候我们会同时维护两个github的账号里面的仓库内容,这时候本地git需要频繁的切换ssh,以方便灵活的与两个账号的仓库可以通信。这篇日记将阐述我是怎么解决这个问题的。1. 第一个账…

Linux shell编程学习笔记78:cpio命令——文件和目录归档工具(上)

0 前言 在Linux系统中,除了tar命令,我们还可以使用cpio命令来进行文件和目录的归档。 1 cpio命令的功能,帮助信息,格式,选项和参数说明 1.1 cpio命令的功能 cpio 名字来自 "copy in, copy out"&#xf…

游戏开发| Unreal5.2-5.4接入chatGPT定制游戏NPC

引擎版本UE5.2 (也支持到5.4,有试用其它插件所以选择之前版本) 使用插件(免费) 1.VArest (插件官方介绍:Plugin that makes REST communications much easier.)可以让REST(Representational State Transfer)通信变得更加容易,涉及客户端与服务器之间通过 HTTP 协议…

windows C++-并行编程-并行算法(四)- 并行排序

并行模式库 (PPL) 提供了对数据集合并行地执行工作的算法。这些算法类似于 C 标准库提供的算法。并行算法由并发运行时中的现有功能组成。 PPL 提供三种排序算法:concurrency::parallel_sort、concurrency::parallel_buffered_sort 和 concurrency::parallel_radix…

VS Code 配置 Rust-Analyzer 报错

报错信息: Bootstrap Error" rust-analyzer requires glibc > 2.28 in latest build. 参考了好多地方, https://github.com/rust-lang/rust-analyzer/issues/11558 https://blog.csdn.net/aLingYun/article/details/120923694 https://rust-anal…

Fair Graph RepresentationLearning via Diverse Mixture-of-Experts

发表于:WWW23 推荐指数: #paper/⭐⭐ 问题背景: 背景 现实世界的数据很多样,阻止GNN学习公平的表示。当去偏见化后,他们面临着可学知识不足且属性有限的重大问题 解决方法: 应对公平训练导致可学习知识…