介绍
分组箱线图(Grouped Boxplot)是一种用于展示不同组别数据分布情况的统计图表。它将箱线图(Boxplot)按照不同的类别或组别进行分组,使得可以同时比较多个组别的数据特征。
箱线图本身是一种标准化的显示数据分布的方法,它能够展示数据的中位数、四分位数以及异常值。箱线图的主要元素包括:
- 中位数线:箱线图中的中位数值,表示数据的中心位置。
- 上四分位数箱线:从上四分位数到中位数的区域。
- 下四分位数箱线:从下四分位数到中位数的区域。
- 上须(Whisker):表示数据的离散程度,通常延伸至上四分位数之上1.5倍的四分位距,或者到最大值,以两者中较小者为准。
- 下须:同理,下须延伸至下四分位数之下1.5倍的四分位距,或者到最小值。
- 异常点:超出上须和下须的点,通常被认为是异常值或离群点。
当箱线图用于多个组别时,每个组别都会有自己的箱线图,这些箱线图在图表上水平或垂直排列,形成分组箱线图。这种图表能够直观地比较不同组别的数据分布特征,例如:
- 中位数的比较:不同组别的中心趋势。
- 四分位数范围的比较:不同组别的数