vif-方差膨胀因子计算

vif-方差膨胀因子计算

news/2025/3/29 3:51:57/文章来源:https://blog.csdn.net/hbkybkzw/article/details/145292132

vif-方差膨胀因子

使用statsmodels中的variance_inflation_factor，数据集使用乳腺癌数据集

import pandas as pd
import numpy as np
from sklearn.datasets import load_breast_cancer
from tqdm import notebook
from statsmodels.stats.outliers_influence import variance_inflation_factor
from statsmodels.tools import add_constantcancer = load_breast_cancer()
df = pd.DataFrame(cancer.data,columns=['_'.join(i.split()) for i in cancer.feature_names])
df['y'] = cancer.targetdef calc_vif(df,desc_dict=None):"""df: DataFramedesc_dict: 字段中文释义字典return: vif DataFrame"""X=add_constant(df)vif_list = []for i in notebook.tqdm(range(X.shape[1])):vif = variance_inflation_factor(X.values,i)vif_list.append(vif)s = pd.DataFrame(vif_list,index=X.columns)s = s.reset_index()s.columns = ['feature','vif']if desc_dict:s['中文释义'] = s.feature.map(desc_dict)s = s[['feature','中文释义','vif']]return sstr_list = df.select_dtypes(include='object').columns.tolist() # string类型
flo_list = df.select_dtypes(exclude='object').columns.tolist() # 连续型# vif 不能计算string类型
df_vif = df[flo_list]# vif 计算不能有空值
for i in notebook.tqdm(flo_list):df_vif[i] = df_vif[i].fillna(0)vif_data = calc_vif(df_vif)
vif_data

20230104I7cHIZ

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/5298.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

查看电脑或笔记本CPU的核心数方法及CPU详细信息

查看电脑或笔记本CPU的核心数方法及CPU详细信息

一、通过任务管理器查看 1.打开任务管理器可以按下“Ctrl Shift Esc”组合键，或者按下“Ctrl Alt Delete”组合键后选择“任务管理器”来打开。 2.查看CPU信息在任务管理器界面中，点击“性能”标签页，找到CPU使用记录区域&#xff0c…

阅读更多...

数据恢复常见故障（四）关键信号的耦合电容撞件后导致SATA前端通信异常

数据恢复常见故障（四）关键信号的耦合电容撞件后导致SATA前端通信异常

数据恢复常见故障（四）关键信号耦合电容撞件后导致SATA前端通信异常 SATA固态硬盘SATA差分信号上有耦合电容，电容被撞件后，偏移，导致接触不良，引起SATA前端信号通信异常，故障现象表现为不认盘&a…

阅读更多...

[HCTF 2018]WarmUp

[HCTF 2018]WarmUp

题目：一上来给了个图片还是很懵的，于是尝试查看一下源代码：发现有提示：于是访问source.php得到了php代码：(这里将代码和代码分析放一块) <?phphighlight_file(__FILE__); class emmm{public static function chec…

阅读更多...

MYSQL数据库基础-01.数据库的基本操作

MYSQL数据库基础-01.数据库的基本操作

数据库的语法是大小写不敏感的，可以使用大写，也可以使用小写。每条语句要以；结尾，可以多行输入。名称不能是关键字,若想用关键字命名,要用反引号引起来。目录一.数据库的基本操作 1.创建数据库： 2.查看数据库…

阅读更多...

Decode Global专注金融创新，构建便捷的交易平台

Decode Global专注金融创新，构建便捷的交易平台

随着金融市场持续进阶，越来越多的年轻正在涌入金融交易的体系中，针对当下年轻人崇尚精简，优中取优的特点，Decode Global紧跟金融市场发展的步伐，不断创新体验，致力于打造一个精简快捷，安全便捷的…

阅读更多...

系统思考—转型

系统思考—转型

我们大多数问题的来源是：人们的思考方式与大自然的运作方式之间的差异。——葛雷果利贝特森（人类学家、生物学家及系统思考先驱） 在企业转型的过程中，许多企业创始人常常面临一个困境——过去的成功经验和旧有的思维方式&#xf…

阅读更多...

Flutter：carousel_slider 横向轮播图、垂直轮播公告栏实现

Flutter：carousel_slider 横向轮播图、垂直轮播公告栏实现

安装依赖 carousel_slider: ^5.0.01、垂直滚动公告栏 import package:carousel_slider/carousel_options.dart;// 垂直滚动公告栏Widget _buildNotice() {return <Widget>[<Widget>[TDImage(assetUrl: "assets/img/home11.png",width: 60.w,height: 60.w…

阅读更多...

【二叉树的深搜】计算布尔二叉树的值求根节点到叶节点数字之和

【二叉树的深搜】计算布尔二叉树的值求根节点到叶节点数字之和

文章目录 2331. 计算布尔二叉树的值解题思路：后序遍历129. 求根节点到叶节点数字之和解题思路：深度优先搜索前序遍历 2331. 计算布尔二叉树的值 2331. 计算布尔二叉树的值给你一棵完整二叉树的根，这棵树有以下特征： 叶子节…

阅读更多...

【高阶数据结构】布隆过滤器（BloomFilter）

【高阶数据结构】布隆过滤器（BloomFilter）

1. 概念 1.1 背景引入背景：在计算机软件中，一个常见的需求就是在一个集合中查找一个元素是否存在 ，比如：1. Word 等打字软件需要判断用户键入的单词是否在字典中存在 2. 浏览器等网络爬虫程序需要保存一个列表来记录已经遍历过…

阅读更多...

偏序关系.

偏序关系.

一、偏序（半序）关系偏序关系自反反对称传递性二、全序（线序、链）关系三、偏序集中的重要元素 1. 极大元与极小元极大元找所在集合的一个或几个最高点； 极小元找所在集合的一个或几个最低点。 2. 最大元与最小…

阅读更多...

国产编辑器EverEdit - 列编辑模式

国产编辑器EverEdit - 列编辑模式

1 列模式 1.1 应用背景在编辑CSV格式，或者比较规整的配置文件时，可能会用到一列的内容都要进行修改的情况，在不支持列模式的编辑器中，可能需要用户逐行去编辑，比如有下面一段扯淡文本： ADD NRNFREQ:LOCA…

阅读更多...

论文笔记（六十三）Understanding Diffusion Models: A Unified Perspective（一）

论文笔记（六十三）Understanding Diffusion Models: A Unified Perspective（一）

Understanding Diffusion Models: A Unified Perspective（一） 文章概括引言：生成模型背景：ELBO、VAE 和分层 VAE证据下界（Evidence Lower Bound）变分自编码器 （Variational Autoencoders&#x…

阅读更多...

【重庆市乡镇界】面图层shp格式arcgis数据乡镇名称和编码wgs84坐标无偏移内容测评

【重庆市乡镇界】面图层shp格式arcgis数据乡镇名称和编码wgs84坐标无偏移内容测评

标题中的“最新重庆市乡镇界面图层shp格式arcgis数据乡镇名称和编码wgs84坐标无偏移最新”指的是一个地理信息系统（GIS）的数据集，特别设计用于ArcGIS软件。这个数据集包含了重庆市所有乡镇的边界信息，以Shapefile（.shp…

阅读更多...

【0x04】HCI_Connection_Request事件详解

【0x04】HCI_Connection_Request事件详解

目录一、事件概述二、事件格式及参数 2.1. HCI_Connection_Request 事件格式 2.2. BD_ADDR 2.3. Class_Of_Device 2.4. Link_Type 三、主机响应 3.1. ACL链接类型 3.2. SCO或eSCO链接类型四、应用场景 4.1. 设备配对场景 4.2. 蓝牙文件传输场景 4.3. 蓝牙物联网…

阅读更多...

9. 神经网络（一.神经元模型）

9. 神经网络（一.神经元模型）

首先，先看一个简化的生物神经元结构： 生物神经元有多种类型，内部也有复杂的结构，但是可以把单个神经元简化为3部分组成： 树突：一个神经元往往有多个树突，用于接收传入的信息。轴突：…

阅读更多...

CTTSHOW-WEB入门-爆破25-28

CTTSHOW-WEB入门-爆破25-28

web25 题目：解题思路及步骤：分析代码： error_reporting(0); include("flag.php");//包含文件flag.php if(isset($_GET[r])){$r $_GET[r];//获取参数rmt_srand(hexdec(substr(md5($flag), 0,8)));$rand intval($r)-intval(mt_ra…

阅读更多...

win32汇编环境,对多行编辑框添加或删除文本

win32汇编环境,对多行编辑框添加或删除文本

;运行效果 ;win32汇编环境,对多行编辑框添加或删除文本 ;主要要先设置文本的开始点与结束点，然后把一段文本顶替上去。没有添加文本或删除文本的概念，只有顶替。如果开始点与结束点都是前面文本的长度值，则成了从后面添加文本的效果。如果结束…

阅读更多...

AutoGen入门——快速实现多角色、多用户、多智能体对话系统

AutoGen入门——快速实现多角色、多用户、多智能体对话系统

1.前言如https://github.com/microsoft/autogen所述，autogen是一多智能体的框架，属于微软旗下的产品。依靠AutoGen我们可以快速构建出一个多智能体应用，以满足我们各种业务场景。本文将以几个示例场景，使用AutoGen快速构建出…

阅读更多...

项目中使用的是 FastJSON（com.alibaba:fastjson）JSON库

项目中使用的是 FastJSON（com.alibaba:fastjson）JSON库

从你的 pom.xml 文件中可以看到，项目明确依赖了以下 JSON 库： FastJSON： <dependency><groupId>com.alibaba</groupId><artifactId>fastjson</artifactId><version>1.2.47</version> </depende…

阅读更多...

EAMM: 通过基于音频的情感感知运动模型实现的一次性情感对话人脸合成

EAMM: 通过基于音频的情感感知运动模型实现的一次性情感对话人脸合成

EAMM: 通过基于音频的情感感知运动模型实现的一次性情感对话人脸合成 1所有的材料都可以在EAMM: One-Shot Emotional Talking Face via Audio-Based Emotion-Aware Motion Model网站上找到。摘要尽管音频驱动的对话人脸生成技术已取得显著进展，但现有方法要么忽…

阅读更多...

最新文章

推荐文章