Isolation Forest孤立森林（二）之sklearn实现,源码分析

孤立森林算法sklearn实现,源码分析

算法一：首先初始化一些参数

class sklearn.ensemble.IsolationForest(n_estimators=100, max_samples=’auto’, contamination=’legacy’, max_features=1.0, bootstrap=False, n_jobs=None, behaviour=’old’, random_state=None, verbose=0)

参数解释:n_estimators = 构建多少个itree

max_samples=采样数，自动是256

contamination=c(n)默认为0.1

max_features=最大特征数默认为1

bootstrap=构建Tree时，下次是否替换采样，为True为替换，为False为不替换

n_jobs=fit和perdict执行时的并行数

第二步进行fit训练：def fit(self, X, y=None, sample_weight=None):

其中max_samples:

if self.max_samples == 'auto':

max_samples = min(256, n_samples) #如果输入的采样数大于256，就选择256，小于256选择输入的max_samples
itree的最大路径为:max_depth = int(np.ceil(np.log2(max(max_samples, 2))))

然后将max_samples,max_depth,X，sample_weight 传入

super(IsolationForest, self)._fit(X, y, max_samples,max_depth=max_depth,sample_weight=sample_weight)

进行统计：使用Scipy我们很方便的得到数据所在区域中某一百分比处的数值

self.threshold_ = -sp.stats.scoreatpercentile(-self.decision_function(X), 100. * (1. - self.contamination))

 return self

fit方法就此结束了，下面是创建树也是进行分类的过程。

def decision_function(self, X):

未完待续

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/52078.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

Isolation Forest孤立森林（二）之sklearn实现,源码分析

孤立森林算法sklearn实现,源码分析

相关文章

森林图

BFT 最前线 | 互联网惊现 AI 鬼城,中国电信天翼云将发布预训练大模型,周鸿祎谈“万模大战”

竞逐对话式AI，百度、字节各有千秋

老罗的聊天宝，Low的另一面

专访罗升阳：老罗的Android之旅

小红书内测淘宝外链，小红书商业化布局加速？！

人工智能 charGPT 机器学习算力技术相关(对于常用框架、库、技术)等名词的解释收集整理和自我理解

【Qt快速扫盲】QT概述_GUI程序创建_基础知识点等

【Qt】第一、二章：Qt Creator介绍及Hello World程序示例

Qt 5框架介绍

Qt学习笔记(三十)：Qt 中的绘图

【Qt入门第16篇】 2D绘图（六）坐标系统

使用Qt进行程序开发的过程记录

Qt开发技术：Qt绘图系统（二）QPainter详解

Qt绘图与信号事件

我的Qt作品（9）Qt使用Cairo绘图引擎提升抗锯齿效果【开源】

基于Qt的多媒体综合应用程序设计（2）

VS+Qt+鼠标框选后掩膜去除背景

QT—3D绘图

【Qt】Qt环境配置与入门案例