箱线图(Box Plot)可以直观地反映数据的分布情况,主要包括以下几个部分:
1. 中位数(Median): 箱子中线代表了数据的中位数,表示数据集合的中心位置。
2. 上下四分位数(Upper and Lower Quartile): 箱子的上下边缘分别代表了数据的上四分位数(Q3)和下四分位数(Q1),反映了数据的中间50%区间。
3. 最大值和最小值(Max and Min): 箱须(胡须)的两端分别代表了数据的最大值和最小值,反映了数据的整体范围。
4. 异常值(Outliers): 如果有任何数据点落在箱须之外,则被视为异常值。异常值通常用圆点或星号表示。
通过观察箱线图可以了解:
- 数据集中趋势和离散程度: 中位数位置和箱子大小反映了数据的集中趋势和离散程度。
- 数据偏斜性: 箱线图的对称性反映了数据的分布是否偏斜。
- 离群值: 箱线图可以直观地识别出数据中的离群值。