统计绘图 | 既能统计分析又能可视化绘制的技能

在典型的探索性数据分析工作流程中,数据可视化统计建模是两个不同的阶段,而我们也希望能够在最终的可视化结果中将相关统计指标呈现出来,如何让将两种有效结合,使得数据探索更加简单快捷呢?今天这篇推文就告诉你如何高效解决这个问题。

  • R-ggstatsplot 统计可视化包介绍

  • R-ggstatsplot 统计类型

  • 更多详细的数据可视化教程,可订阅我们的店铺课程:

R-ggstatsplot 统计可视化包介绍

R-ggplot2 拥有超强的可视化绘制能力(小编用完果断安利)我们是知道的,但对于数据的统计分析结果进行展示,ggplot2还也有所欠缺,而R-ggstatsplot包的出现则可弥补不足(小编在研究生期间可没少使用该包绘图)。

  1. 官网 https://indrajeetpatil.github.io/ggstatsplot/

  2. 提供的绘图函数

  • ggbetweenstats:(violin plots) 用于比较多组/条件之间的统计可视化结果

  • ggwithinstats:(violin plots) 用于比较多组/条件内部间的统计可视化结果

  • gghistostats:(histograms) 用于数字型变量的分布。

  • ggdotplotstats:(dot plots/charts) 用于表示有关标记数字变量的信息分布抢矿

  • ggscatterstats:(scatterplots) 用于表示两个变量之间的相关性。

  • ggcorrmat:(correlation matrices) 用于表示多个变量之间的相关性。

  • ggpiestats:(pie charts) 用于表示类别型数据。

  • ggbarstats:(bar charts) 用于表示类别型数据

  • ggcoefstats:(dot-and-whisker plots) 用于回归模型和meta-分析。

接下来,我们就列举几个常用的可视化函数进行展示。

R-ggstatsplot 统计类型

  • ggbetweenstats

plot2 <- ggstatsplot::ggbetweenstats(data = datasets::morley,x = Expt,y = Speed,type = "nonparametric",plot.type = "box",title = "ggbetweenstats example02",xlab = "The experiment number",ylab = "Speed-of-light measurement",caption = "Visualization by DataCharm",pairwise.comparisons = TRUE,p.adjust.method = "fdr",outlier.tagging = TRUE,outlier.label = Run,ggtheme = hrbrthemes::theme_ipsum(base_family = "Roboto Condensed"),ggstatsplot.layer = FALSE
)

ggbetweenstats

  • ggwithinstats

# for reproducibility and data
set.seed(123)
library(WRS2)# plot
plot3 <- ggwithinstats(data = WineTasting,x = Wine,y = Taste,title = "Wine tasting",caption = "Data source: `WRS2` R package",ggtheme = hrbrthemes::theme_ipsum(base_family = "Roboto Condensed"),ggstatsplot.layer = FALSE
)

ggwithinstats

  • gghistostats

# for reproducibility
set.seed(123)# plot
plot4 <- gghistostats(data = ggplot2::msleep, # dataframe from which variable is to be takenx = awake, # numeric variable whose distribution is of interesttitle = "Amount of time spent awake", # title for the plotcaption = substitute(paste(italic("Source: "), "Mammalian sleep data set")),test.value = 12, # default value is 0binwidth = 1, # binwidth value (experiment)ggtheme = hrbrthemes::theme_ipsum(base_family = "Roboto Condensed"), # choosing a different themeggstatsplot.layer = FALSE # turn off ggstatsplot theme layer
)

gghistostats

  • grouped_gghistostats

# for reproducibility
set.seed(123)# plot
plot5 <- grouped_gghistostats(data = dplyr::filter(.data = movies_long,genre %in% c("Action", "Action Comedy", "Action Drama", "Comedy")),x = budget,test.value = 50,type = "nonparametric",xlab = "Movies budget (in million US$)",grouping.var = genre, # grouping variablenormal.curve = TRUE, # superimpose a normal distribution curvenormal.curve.args = list(color = "red", size = 1),title.prefix = "Movie genre",ggtheme = hrbrthemes::theme_ipsum(base_family = "Roboto Condensed"),# modify the defaults from `ggstatsplot` for each plotggplot.component = ggplot2::labs(caption = "Source: IMDB.com"),plotgrid.args = list(nrow = 2),annotation.args = list(title = "Movies budgets for different genres")
)

grouped_gghistostats

  • ggscatterstats

plot6 <- ggscatterstats(data = ggplot2::msleep,x = sleep_rem,y = awake,xlab = "REM sleep (in hours)",ylab = "Amount of time spent awake (in hours)",title = "Understanding mammalian sleep",ggtheme = hrbrthemes::theme_ipsum(base_family = "Roboto Condensed")
)

ggscatterstats

  • ggcorrmat

# for reproducibility
set.seed(123)# as a default this function outputs a correlation matrix plot
plot7 <- ggcorrmat(data = ggplot2::msleep,colors = c("#B2182B", "white", "#4D4D4D"),title = "Correlalogram for mammals sleep dataset",subtitle = "sleep units: hours; weight units: kilograms",ggtheme = hrbrthemes::theme_ipsum(base_family = "Roboto Condensed")
)

ggcorrmat

  • ggbarstats

# for reproducibility
set.seed(123)
library(ggplot2)# plot
plot8 <- ggbarstats(data = movies_long,x = mpaa,y = genre,title = "MPAA Ratings by Genre",xlab = "movie genre",legend.title = "MPAA rating",ggtheme = hrbrthemes::theme_ipsum(base_family = "Roboto Condensed"),ggplot.component = list(ggplot2::scale_x_discrete(guide = ggplot2::guide_axis(n.dodge = 2))),palette = "Set2"
)

ggbarstats

跟多详细例子,小伙伴们可参考官网进行解读。其保存图片的方式使用ggsave()即可。

总结

这一篇推文我们介绍了R-ggstatsplot进行统计分析并将结果可视化,极大省去了绘制单独指标的时间,为统计分析及可视化探索提供非常便捷的方式,感兴趣的小伙伴可仔细阅读哦~~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/347556.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Nginx 网站服务

一.Nginx 概述 1.一款高性能、轻量级Web服务软件 稳定性高 系统资源消耗低 对HTTP并发连接的处理能力高 单台物理服务器可支持30000~5000个并发请求 2.Nginx与Apache区别 最核心的区别在于 Nginx 采用异步非阻塞机制&#xff0c;多个连接可以对应一个进程&#xff1b;Apache 采…

HyperAI超神经 x MoonBit | 与中科院、Intel 等专家共话基础软件前沿发展与期待

本次 Meetup 将讨论 MoonBit 编程语言、RuyiSDK、WAMR和 RISC-V 等技术&#xff0c;来现场参与不仅可以学习到最前沿的技术知识&#xff0c;更可与大咖面对面互动交流心得&#xff0c;还有美食茶歇与精美礼品&#xff0c;期待你的到来&#xff01; 扫码立即报名 ⬇️ 活动详情…

自动驾驶#芯片-1

概述 汽车是芯片应用场景之一&#xff0c;汽车芯片需要具备车规级。  车规级芯片对加工工艺要求不高&#xff0c;但对质量要求高。需要经过的认证过程&#xff0c;包括质量管理标准ISO/TS 16949、可靠性标准 AEC-Q100、功能安全标准ISO26262等。  汽车内不同用途的芯片要求…

SAP CS01/CS02/CS03 BOM创建维护删除BAPI使用及增强改造

BOM创建维护删除相关BAPI的使用代码参考示例&#xff0c;客户电脑只能远程桌面&#xff0c;代码没法复制粘贴出来&#xff0c;只能贴图。 创建及修改BAPI: CSAP_MAT_BOM_MAINTAIN。 删除BAPI: CSAP_MAT_BOM_DELETE。 改造BAPI: CSAP_MAT_BOM_MAINTAIN 改造点1&#xff1a;拷…

贪吃蛇小游戏简单制作-C语言

文章目录 游戏背景介绍实现目标适合人群所需技术浅玩Window API什么是API控制台程序窗口大小,名称设置 Handle(句柄)获取句柄 坐标结构体设置光标位置 光标属性获取光标属性设置光标属性 按键信息获取 贪吃蛇游戏设计游戏前的初始化设置窗口的大小和名称本地化设置 宽字符Waht …

金士顿U盘被写保护的解决方法

1.适用的U盘芯片信息 USB设备ID: VID 0951 PID 1666 设备供应商: Kingston 设备名称: DataTraveler 3.0 设备修订版: 0110 产品制造商: Kingston 产品型号: DataTraveler 3.0 产品修订版: PMAP 主控厂商: Phison(群联) 主控型号: PS2251-07(PS2307) - F/W 08.03.50 [2018-…

ViewModel原理分析

认识 ViewModel ViewModel 是一种用来存储和管理UI相关数据的类。 ViewModel 的作用可以从两个方面去理解&#xff1a; UI界面控制器&#xff1a;在最初的MVC模式中&#xff0c;由于 Activity / Fragment 承担的职责过重&#xff0c;因此在后续的 MVP、MVVM 模式中&#xff…

【C++进阶】模板与仿函数:C++编程中的泛型与函数式编程思想

&#x1f4dd;个人主页&#x1f339;&#xff1a;Eternity._ ⏩收录专栏⏪&#xff1a;C “ 登神长阶 ” &#x1f921;往期回顾&#x1f921;&#xff1a;栈和队列相关知识 &#x1f339;&#x1f339;期待您的关注 &#x1f339;&#x1f339; ❀模板进阶 &#x1f9e9;<&…

OpenGauss数据库-8.权限管理

第2关&#xff1a;权限设置 gsql -d postgres -U gaussdb -W passwd123123 CREATE ROLE lily WITH CREATEDB PASSWORD passwd123123; GRANT lily TO gaussdb; 第3关&#xff1a;管理员 gsql -d postgres -U gaussdb -W passwd123123 CREATE USER peter WITH SYSADMIN PASSWOR…

uniapp地图选择位置

直接上代码 通过一个点击事件调用官方api即可调用 点击调用成功后显示如下 然后选择自己所需要的位置即可

解读光纤模块的参数有哪些

光模块的具体参数有传输速率、传输距离、中心波长、光纤类型、光口类型、工作温度范围、最大功耗等。下面给大家详解一下各个参数的作用 因为光纤本身对光信号有色散、损耗等副作用。因此不同类型的光源发出的光所能传输的距离不一样。对接光接口时&#xff0c;应根据最远的信号…

AutoKG:为语言模型打造高效自动化知识图谱

在人工智能领域&#xff0c;大型语言模型&#xff08;LLMs&#xff09;如BERT、RoBERTa、T5和PaLM等&#xff0c;以其在自然语言处理&#xff08;NLP&#xff09;任务中的卓越性能而著称。然而&#xff0c;这些模型在提供信息时可能会产生“幻觉”&#xff0c;即提供看似合理但…

Vue 路由传递参数 query、params

1、to的对象写法,绑定参数 <template> 2 <ul> 3 <li v-for"m in messlist" :key"m.id"> 4 <router-link :to"{ //使用params时&#xff0c;这个路径必须用name及别名......name: xiangqing, path: /bbb/message/deta…

Python酷库之旅-比翼双飞情侣库(01)

目录 一、xlrd库的由来 二、xlrd库优缺点 1、优点 1-1、支持多种Excel文件格式 1-2、高效性 1-3、开源性 1-4、简单易用 1-5、良好的兼容性 2、缺点 2-1、对.xlsx格式支持有限 2-2、功能相对单一 2-3、更新和维护频率低 2-4、依赖外部资源 三、xlrd库的版本说明 …

如何格式化SQL语句(以MySQL和SQLynx为例)

目录 1 SQLynx 格式化MySQL的SQL 语句功能介绍 1.1 主要特点 1.2 使用步骤 1.3 操作示例 2 结论 SQLynx 是一款功能强大的 SQL 集成开发环境&#xff08;IDE&#xff09;&#xff0c;它提供了多种工具和功能来提高用户的生产力和代码质量。其中&#xff0c;SQL 语句的格式…

Mybatis Log Free

安装后重启 在 application.yml 配置 configuration: log-impl: org.apache.ibatis.logging.stdout.StdOutImpl 选择效果

Java---BigInteger和BigDecimal和枚举

1.简介 1.BigInteger可以支持任意长度的整数 2.BigDecimal可以支持任意精度的浮点数 3.用来做精确计算 2.创建方式 new BigInteger(); new BigInteger(参数1,进制)&#xff1a;可以将不同进制转成10进制显示 new BigDecimal(); BigInteger.valueOf(); BigDecimal.valueOf();…

vue30:props详解

1&#xff1a;props类型校验&#xff1a; 2&#xff1a;props类型自定义校验&#xff1a; 3:子组件不能通过prop直接修改父组件的数据

阿里云物联网平台案例教程

1、定义&#xff1a; ​ 物联网&#xff08;简称IOT&#xff09;把任何物体与物联网相连接&#xff0c;进行消息的交换和通信&#xff0c;实现对物品的智能化识别。简单说是&#xff1a;物联网就是把所有的物体连接起来相互作用&#xff0c;形成一个互联互通的网络&#xff0c…

[发布]嵌入式系统远程测控软件-基于Qt

目录 一. 引言二. 软件功能2.1 原理2.2 软件功能2.3 运行环境 三. 软件操作使用3.1 软件界面3.2 软件功能使用详解3.2.1 连接3.2.2 数据监测&#xff08;串口示波器&#xff09;3.2.3 数据修改3.2.4 数据保存 3.3 软件的硬件连接 四. 通信协议——STM32移植篇4.1 通信协议4.2 S…