决策树的学习(Decision Tree)

1.对于决策树的概念:

**本质上:**决策树就是模拟树的结构基于 if-else的多层判断
在这里插入图片描述

2.目的:
对实例进行分类的树形结构,通过多层判断,将所提供的数据归纳为一种分类规则
3.优点:
1.计算量小,无需考虑损失函数,运行速度快
2.便于理解
4.缺点:
1.忽略了属性之间的相关性,比如我们的逻辑回归,sigmod函数它考虑了属性之间的相关性,比如是否具有学习兴趣,可能学习动力和学习时间是有一定的关联的,逻辑回归就考虑了相关性,但是决策树就没有考虑。
2.样本类别分布不均匀时,容易影响模型的表现。

2.例子:

根据特征进行判断,不同特征决定了不同的决策树;
在这里插入图片描述

2.1 ID3算法的学习

在这里插入图片描述

2.2 . 信息熵的概念:

1.决策树的难点在于找到最合适的属性作为我们所判断的信息
2.最合适的判断:在于信息熵,熵越大说明信息的不确定性就越大,而信息熵跟我们的信息增益是直接相关的,信息熵越小,信息增益就越大;
在这里插入图片描述
2.信息增益的概念:
信息熵尽可能小,那么我们Gain(D,a)所获取的信息增益就更大。
类别越少,Dv/D就越小,信息增益就越大
在这里插入图片描述

2.2 选择哪个属性作为我们的类别:

计算信息增益最大的属性作为我们的第一个节点:
在这里插入图片描述
在这里插入图片描述
决策树展示:
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/324571.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【高阶数据结构】LRU Cache -- 详解

一、什么是 LRU Cache LRU(Least Recently Used),意思是最近最少使用,它是一种 Cache 替换算法。 什么是 Cache? 狭义的 Cache 指的是位于 CPU 和主存间的快速 RAM,通常它不像系统主存那样使用 DRAM 技术&…

大模型微调之 在亚马逊AWS上实战LlaMA案例(八)

大模型微调之 在亚马逊AWS上实战LlaMA案例(八) 微调技术 Llama 等语言模型的大小超过 10 GB 甚至 100 GB。微调如此大的模型需要具有非常高的 CUDA 内存的实例。此外,由于模型的大小,训练这些模型可能会非常慢。因此&#xff0c…

HBase 读写流程

HBase 读写流程 1. 读流程 Client先访问zookeeper,从zookeeper获取meta region的位置从meta region中读取meta表中的数据,meta中存储了用户表的region信息;根据namespace、表名和rowkey在meta表中找到对应的region信息;找到这个r…

以C++为核心语言的高频交易系统是如何做到低延迟的?

在开始前我有一些资料,是我根据网友给的问题精心整理了一份「 c的资料从专业入门到高级教程」, 点个关注在评论区回复“888”之后私信回复“888”,全部无偿共享给大家!!! 问题中限定语言是C,可…

暗区突围PC测试资格 暗区突围PC端测试资格获取教程

《暗区突围》的横空出世,犹如一颗震撼弹投入了游戏圈,它不仅颠覆了传统射击游戏的框架,更以独特的撤离生存机制和深度的装备打造系统,激发了无数玩家的探险欲和竞技精神。在这个由精密设计的地图和复杂多变的战术构成的虚拟舞台中…

基于Springboot+Vue的Java项目-旅游网站系统开发实战(附演示视频+源码+LW)

大家好!我是程序员一帆,感谢您阅读本文,欢迎一键三连哦。 💞当前专栏:Java毕业设计 精彩专栏推荐👇🏻👇🏻👇🏻 🎀 Python毕业设计 &am…

464. 我能赢吗

464. 我能赢吗 原题链接:完成情况:解题思路:参考代码:_464我能赢吗_记忆化dp 错误经验吸取 原题链接: 464. 我能赢吗 https://leetcode.cn/problems/can-i-win/description/ 完成情况: 解题思路&#x…

C#知识|将选中的账号信息展示到控制台(小示例)

哈喽,你好啊,我是雷工! 上篇学习了控件事件的统一关联, 本篇通过实例练习继续学习事件统一处理中Tag数据获取、对象的封装及泛型集合List的综合运用。 01 实现功能 在上篇的基础上实现,点击选中喜欢的账号&#xff0…

【数据结构】二叉树(Binary Tree)

文章目录 一、树的概念及结构二、二叉树的概念及结构1.二叉树的概念2.特殊的二叉树3.二叉树的性质 三、二叉树的存储顺序存储链式存储 四、二叉树的实现1.创建二叉树2.二叉树的遍历前序遍历中序遍历后序遍历层序遍历根据遍历顺序创建二叉树 3.二叉树的基本操作1.总结点个数2.二…

拼多多二面,原来是我对自动化测试的理解太浅了

如果你入职一家新的公司,领导让你开展自动化测试,作为一个新人,你肯定会手忙脚乱,你会如何落地自动化测试呢? 01 什么是自动化 有很多人做了很长时间的自动化但却连自动化的概念都不清楚,这样的人也是很悲…

静态分析-RIPS-源码解析记录-02

这部分主要分析scanner.php的逻辑,在token流重构完成后,此时ini_get是否包含auto_prepend_file或者auto_append_file 取出的文件路径将和tokens数组结合,每一个文件都为一个包含require文件名的token数组 接着回到main.php中,此时…

最少数量线段覆盖-华为OD

系列文章目录 文章目录 系列文章目录前言一、题目描述二、输入描述三、输出描述四、java代码五、测试用例 前言 本人最近再练习算法,所以会发布一些解题思路,希望大家多指教 一、题目描述 给定坐标轴上的一组线段,线段的起点和终点均为整数…

搜维尔科技:【案例分享】Xsens用于工业制造艺术创新设计平台

用户名称:北京理工大学 主要产品:Xsens MVN Awinda惯性动作捕捉系统 在设计与艺术学院的某实验室内,通过Xsens惯性动作捕捉,对人体动作进行捕捉,得到人体三维运动数据,将捕到的数据用于后续应用研究。…

挖了谷歌一个 XSS 漏洞,获奖三千美金

大家好,我是楷鹏。 程序员 Matan 挖到了一个 XSS 漏洞并报告给谷歌,奖励 3133.7 美金(约合人民币 22666 元) 这是谷歌 Bug Hunter 的奖励规则: 👉 图片来自 https://bughunters.google.com/about/rules/…

解锁网站SEO优势,百度站长工具助您一臂之力(百度站长平台还提供了哪些工具供seo人员使用?)

在当今数字化时代,网站已经成为企业宣传、产品销售、信息发布的主要渠道之一。有着再好的网站,如果在百度等搜索引擎中无法被用户搜索到,那就等于白搭。因此,网站的SEO优化显得尤为重要。而作为国内最大的搜索引擎,百度…

Web Component fancy-components

css-doodle 组件库 fancy-components 组件库使用 yarn add fancy-components使用: import { FcBubbles } from fancy-components new FcBubbles() //要用哪个就new哪个 new 这里可能会报错eslink,eslintrc.js中处理报错 module.exports {rules: {no-new: off} …

物联网SCI期刊,潜力新刊,审稿速度快,收稿范围广泛!

一、期刊名称 Internet of Things 二、期刊简介概况 期刊类型:SCI 学科领域:物联网 影响因子:5.9 中科院分区:3区 出版方式:订阅模式/开放出版 版面费:选择开放出版需支付$2310 三、期刊征稿范围 I…

网页转长图插件html2canvas【前端】

网页转长图插件html2canvas【前端】 前言版权开源推荐网页转长图插件html2canvas【前端】wkImageStorage流程使用后端application.propertiesWkConfigShareControllerImageCleanupTask 前端html2canvas.jsshare.htmlshare.jsgetShare.jsgetShare.html 最后 前言 2024-5-10 18:…

国内运营商选择爱立信,或因它的低频5G技术更先进,价格更便宜

国内某运营商将大笔5G设备订单交给爱立信,引发了掀然大波,影响仍在扩散,对此各方说什么原因都有,笔者认为爱立信此次斩获大单,可能在于它的低频5G设备更先进,价格更便宜,对于急于降低成本的国内…

2024高安全个人密码本程序源码,贴身密码管家-随机密码备忘录二代密码

项目概述: 在这个网络高度发展的时代,每个人都需要上网,而上网就不可避免地需要使用账号和密码。 在众多账号的情况下,你是否还在为复杂难记的密码感到烦恼?现在只需要记录一次, 就可以随时查看你的密码…