【Python机器学习】自动化特征选择—

【Python机器学习】自动化特征选择——迭代特征选择

在单变量测试中，没有使用模型；在基于模型的选择中，使用单个模型来选择特征。而在迭代特征选择中，将会构造一系列模型，每个模型都使用不同数量的特征。有两种基本方法：

1、开始时没有特征，然后逐个添加特征，知道满足某个条件终止；

2、从所有特征开始，然后逐个删除特征，知道满足某个条件终止。

由于构造了一系列模型，所以这些方法的计算成本要比单变量统计和基于模型的特征选择要更高。其中一种特殊方法就是递归特征消除，它从所有特征开始构建模型，并根据模型舍弃最不重要的特征，然后使用除被舍弃特征之外的所有特征来构建一个新模型，如此继续，知道仅剩下预设数量的特征。为了让这种方法能够运行，用于选择的模型需要提供某种确定特征重要性的方法，正如基于模型的选择所做的那样。

下面使用一个随机森林模型：

select = RFE(RandomForestClassifier(n_estimators=100,random_state=42),n_features_to_select=40)
select.fit(X_train,y_train)
mask=select.get_support()plt.matshow(mask.reshape(1,-1),cmap='gray_r')
plt.xlabel('Sample index')
plt.show()

与单变量选择和基于模型的特征选择相比，迭代特征选择的结果更好，但仍然露掉了一个特征。而且运行代码所需的时间也长得多，因为对一个随机森林模型训练了40次，每运行一次删除一个特征。

下面，测试一下使用RFE做特征选择时Logistic回归模型的精度

X_train_rfe=select.transform(X_train)
X_test_rfe=select.transform(X_test)
score=LogisticRegression().fit(X_train_rfe,y_train).score(X_test_rfe,y_test)
print(score)

我们还可以利用在RFE内使用的模型来进行预测。这仅使用被选中的特征集：

print("test score:{}".format(select.score(X_test,y_test)))

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/362904.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

【Python机器学习】自动化特征选择——迭代特征选择

相关文章

Django使用

Java nio 的线程通信机制线程通信Pipe

Java网络编程（JavaWeb的基础）

DELL：利用大语言模型（LLM）生成评论与解释，革新虚假信息检测

uboot基本使用网络命令和从服务器端下载linux内核启动

潮玩手办盲盒前端项目模版的技术探索与应用案例

图像处理Python库--图片裁剪、缩放、灰度图、圆角等

第6章复制

Redis 高可用 sentinel

【STM32】GPIO复用和映射

鸿蒙开发HarmonyOS NEXT （二）熟悉ArkUI

MoneyPrinterPlus:AI自动短视频生成工具-微软云配置详解

API-元素尺寸与位置

常用MQ消息中间件Kafka、ZeroMQ和RabbitMQ对比及RabbitMQ详解

企业数据治理必备工具：智能元数据管理平台

模拟实现string【C++】

超详细的Pycharm使用虚拟环境搭建Django项目并创建新的虚拟环境教程

Android笔记-adb keycode大全

【Linux】高级IO——五种IO模型和基本概念，非阻塞IO，fcntl，实现非阻塞IO，同步通信和异步通信

设置日历程序