R语言ggplot2 | 热图+随机森林重要性!升级版~

📋文章目录

  • 原图
  • 复现
    • 定义ggrf_ggcor_plot()函数
    • 加载数据集
    • 一键出图
    • 函数优点

   今天推出一个升级版: ggrf_ggcor_plot的函数。只需要输入 响应变量的矩阵解释变量的矩阵,就能轻松一键生成随机森林重要性+相关性热图。

原图

   所需复现的随机森林变量重要性+相关性热图:

在这里插入图片描述
这整张图由两张结构相似的子图组成,分别代表玉米和水稻。以左侧图为例,它分为两个主要部分。上方的柱状图显示了各个土壤环境变量在随机森林模型中的解释量,下方的热图表示微生物物种丰度与土壤环境变量之间的相关性。其中,热图中每列x轴特定的土壤环境变量作为随机森林模型中的因变量,每个微生物物种的丰度作为随机森林模型中的特征变量。热图中的小圆圈的大小则表示每个特征变量在随机森林模型中的重要性(对应的%MSE值,且p<0.05)。总体来说,这张图旨在揭示不同土壤环境变量如何影响微生物群落的丰度,以及这些微生物群落在随机森林模型中对各个土壤环境变量的重要性。

复现

定义ggrf_ggcor_plot()函数

source("ggrf_ggcor_plot.R")

重新定义了ggrf_ggcor_plot()函数,该函数能够做到一键生图。

需要注意的是:这个函数是在R版本4.2.2基础上定义的。此外,只保证在响应变量和特征变量的数据集样本量相同下进行运行。
主要参数*:

  • response_data:响应变量的数据集,格式为数据框。(因变量)
  • feature_data:解释变量的数据集,格式为数据框。(自变量)
  • seed:种子数,保证每次运行结果一致,必须为整数。

其余参数可以默认,主要包括相关性分析的参数、随机森林及特征变量重要性等细节参数。函数的三个点"…"表示传参用法,这里主要在进行可视化随机森林模型解释量的柱状图中使用到。

输出结果

  • list列表
  • rf_results包括每个随机森林模型的摘要及解释量和p值;
  • cor_df是两个数据集的相关性分析结果,包括对应名称、相关性系数及p值;
  • rf_plot是每个随机森林模型的解释量及p值是否显著的ggplot可视化结果;
  • cor_plot是响应变量和解释变量两个数据集的相关性热图,颜色表示正负,深浅表示大小,圆圈表示的随机森林中不同特征变量对因变量的重要性(只展示%MSE对应p<0.05的)

加载数据集

  • 加载微生物数据
OTU <- openxlsx::read.xlsx("OTU.xlsx", 1)
head(OTU)


行为样本,列为微生物群落种类。

  • 加载土壤环境数据
ENV <- openxlsx::read.xlsx("ENV.xlsx", 1)
head(ENV)


行为样本,列为土壤环境变量。

一键出图

rf_cor_result <- ggrf_ggcor_plot(ENV, OTU, seed = 123, rfp_num_cores = 12, limits = c(-10, 80), breaks = seq(0, 80, 20))
rf_cor_result$rf_plot
rf_cor_result$cor_plot
rf_cor_result$rf_cor_plot

这里,我们处理选择了响应变量解释变量的两个数据集,还设定了seed种子数=123,并设置了在计算计算每个特征变量的重要性%MSE及p值时的核心数=12,这样可以加快我们的运行速度。

需要注意的是我上面提到了"…"作为传参,我们设定在了ggplot2可视化y轴范围的函数中,因此为了让整个图的比例更协调,我定义了y轴的上下限范围limits = c(-10, 80)以及相应的范围间隔breaks = seq(0, 80, 20)

图1,显示的是随机森林模型的解释量。

图2,显示的是相关性分析热图。

图3,是我们的目标图,随机森林重要性+相关性热图。

至此,一键出图已经完成。考虑到大家可能对图形的展示风格或者类型持有不同想法和意见,所以输出的结果为list,也保留了对应随机森林重要性和相关性热图的数据。

用一下代码就可以调用:

  • 相关性分析的数据结果
rf_cor_result$cor_df

  • 随机森林模型的数据结果
rf_cor_result$rf_results

函数优点

  • 便捷使用:一键生成图表,适合快速呈现分析结果。
  • 多样输出:提供多种输出选项,以满足不同需求的用户。
  • 灵活参数:可根据需要自定义参数,具备推广和定制的潜力。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/287841.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

发车,易安联签约某新能源汽车领军品牌,为科技创新保驾护航

近日&#xff0c;易安联成功签约某新能源汽车领军品牌&#xff0c;为其 数十万终端用户 建立一个全新的 安全、便捷、高效一体化的零信任终端安全办公平台。 随着新能源汽车行业的高速发展&#xff0c;战略布局的不断扩大&#xff0c;技术创新不断引领其市场价值走向高点&am…

如何在数字化转型中确保数据安全

随着科技的飞速发展&#xff0c;数字化转型已成为企业发展的必然趋势。数字化转型是指企业利用数字技术对业务流程、组织结构和商业模式进行全面创新和变革&#xff0c;以提高企业的竞争力和创新能力。然而&#xff0c;在数字化转型过程中&#xff0c;数据安全问题日益凸显&…

新能源汽车充电桩主板各模块成本占比解析

汽车充电桩主板是汽车充电桩的重要组件&#xff0c;主要由微处理器模块、通信模块、控制模块、安全保护模块、传感器模块等多个模块构成。深入探究各模块在总成本中的比重&#xff0c;我们可以更好地优化成本结构、提高生产效率&#xff0c;并为未来的技术创新和市场需求变化做…

R语言学习——Rstudio软件

R语言免费但有点难上手&#xff0c;是数据挖掘的入门级别语言&#xff0c;拥有顶级的可视化功能。 优点&#xff1a; 1统计分析&#xff08;可以实现各种分析方法&#xff09;和计算&#xff08;有很多函数&#xff09; 2强大的绘图功能 3扩展包多&#xff0c;适合领域多 …

Docker - 哲学 默认网络和 自定义网络 与 linux 网络类型 和 overlay2

默认网络&#xff1a;不指定 --nerwork 不指定 网络 run 一个容器时&#xff0c;会直接使用默认的网络桥接器 &#xff08;docker0&#xff09; 自定义网络&#xff1a;指定 --nerwork 让这两台容器互相通信 的前提 - 共享同一个网络 关于 ip addr 显示 ens160 储存驱动 ov…

入行AI写作第一个月收入2万+复盘分享

入行AI写作第一个月收入2万复盘分享 AI写作作为一种新兴的创作方式&#xff0c;正逐渐改变着内容产业的生态。在这个领域中&#xff0c;许多人通过自己的努力和智慧&#xff0c;实现了快速的成长和收入的增长。本文将从技术学习与掌握、实践与应用、内容创作与优化、持续学习与…

java 面向对象入门

类的创建 右键点击对应的包&#xff0c;点击新建选择java类 填写名称一般是名词&#xff0c;要知道大概是什么的名称&#xff0c;首字母一般大写 下面是创建了一个Goods类&#xff0c;里面的成员变量有&#xff1a;1.编号&#xff08;id&#xff09;&#xff0c;2.名称&#x…

护眼落地灯怎么选?五款好评连连的护眼大路灯曝光!

现代人越来越重视视力健康&#xff0c;而护眼落地灯则可以很好的提供良好的光线来帮助大家解决平时用眼时的不良光线困扰&#xff0c;因此&#xff0c;受到了很多人喜爱。但是&#xff0c;在产品爆火的同时&#xff0c;市场上也出现了一些质量差且劣质的护眼落地灯&#xff0c;…

Microsoft .NET 应用程序性能监控

什么是 .NET监控 Microsoft .NET 监视在确保可以开发和部署应用程序而不必面对性能滞后或中断方面发挥着重要作用。它使用警报、增长趋势报告和数据可视化技术来帮助管理员确保 Microsoft .NET 平台的全天候可用性。Microsoft.NET 性能监视是一种检测性能异常的先发制人方法&a…

linux 网卡配置 vlan/bond/bridge/macvlan/ipvlan 模式

linux 网卡模式 linux网卡支持非vlan模式、vlan模式、bond模式、bridge模式&#xff0c;macvlan模式、ipvlan模式等&#xff0c;下面介绍交换机端及服务器端配置示例。 前置要求&#xff1a; 准备一台物理交换机&#xff0c;以 H3C S5130 三层交换机为例准备一台物理服务器&…

Nacos配置中心的敏感数据加密处理

为了简化运维工作,使用nacos作为配置中心,但很多敏感数据都是明文存储的,这样一旦数据泄露,可能会造成很大影响,所以最好把这些数据进行加密处理,下面介绍几种数据的加密。 一、数据库信息加密 数据库的配置本篇介绍两种,一是使用druid连接池的,这种比较常见;二是使…

网络安全-提权篇

我们在文件包含的时候可以将错误的用户名包含进日志&#xff0c;但是权限问题让人很烦恼&#xff0c;今天的侧重点主要是跟大家聊一聊提权 用户名包含进日志参考&#xff1a;RCE with LFI and SSH Log Poisoning - Hacking Articles 目录 一、环境 二、看看权限&#xff08;…

vue指令相关

vue中有很多的指令像v-on、v-model、v-bind等是我们开发中常用的 常用指令 v-bind 单向绑定解析表达式 v-model 双向数据绑定 v-for 遍历数组/对象/字符串 v-on 绑定事件监听,可简写为@ v-show 条件渲染(动态控制节点是否存展示) v-if 条件渲染(动态控制节点是否存存在) v…

AI智聊功能支持生成旅游攻略、作文、标题优化,方便视频剪辑

在快节奏的生活中&#xff0c;我们总是需要快速、准确地获取所需信息。无论是撰写旅游攻略、作文&#xff0c;还是准备演讲稿&#xff0c;AI智聊都能为您一键生成精彩文案&#xff0c;让您的创意无限发挥&#xff01; 媒体梦工厂的AI智聊功能&#xff0c;利用先进的自然语言处…

Teamcenter 快速获取所有激活状态用户的方法

问题描述&#xff1a; License数量有限&#xff0c;需要分析Teamcenter 中所有激活状态下的用户&#xff0c;对其进行删减。如何快速获取Teamcenter 中所有激活状态用户呢&#xff1f; 解决方法&#xff1a; Teamcenter Query Builder提供了强大的自定义搜索功能。 新建查询…

软考高级架构师:云原生架构模式概念和例题

作者&#xff1a;明明如月学长&#xff0c; CSDN 博客专家&#xff0c;大厂高级 Java 工程师&#xff0c;《性能优化方法论》作者、《解锁大厂思维&#xff1a;剖析《阿里巴巴Java开发手册》》、《再学经典&#xff1a;《Effective Java》独家解析》专栏作者。 热门文章推荐&am…

v4l2采集视频

Video4Linux2&#xff08;v4l2&#xff09;是用于Linux系统的视频设备驱动框架&#xff0c;它允许用户空间应用程序直接与视频设备&#xff08;如摄像头、视频采集卡等&#xff09;进行交互。 linux系统下一切皆文件&#xff0c;对视频设备的操作就像对文件的操作一样&#xff…

TinyEMU源码分析之启动流程

TinyEMU源码分析之启动流程 1 始于0x10002 确定BBL入口点3 mentry.S执行过程4 启动流程小结 本文属于《 TinyEMU模拟器基础系列教程》之一&#xff0c;欢迎查看其它文章。 本文中使用的代码&#xff0c;均为伪代码&#xff0c;删除了部分源码。 1 始于0x1000 我们沿着TinyEMU…

Java 学习和实践笔记(48):怎样用二维数组来存储表格数据?

怎样用数组的方式&#xff0c;来存储下面这个表格的数据&#xff1f; 示例代码如下&#xff1a; import java.util.Arrays;public class Test001 {public static void main(String[] args) {/*object类对象是类层次结构的根。每个类都有Object作为超类。所有对象&#xff0c;包…

第17篇:七段数码管译码器

Q&#xff1a;之前我们设计实现的逻辑电路最终输出结果都是通过LED显示&#xff0c;本篇我们将实现用七段数码管来显示输出结果。 A&#xff1a;七段数码管显示基本原理&#xff1a;DE2-115开发板有8个共阳极数码管&#xff0c;即低电平逻辑值0点亮数码管段、逻辑值1来使数码管…