首先,应当指出:
平均值是使得直方图上以平均值为界的两侧的加权面积相等的那个点,权重等于相应的面积
块的中心到该均值的距离;
以中位数为界,直方图左右两侧面积相等;
所以对于右长尾,对称,左长尾的分布,有:
右长尾(right skewed):中位数更靠近数据分布区间中心左侧,均值在中位数右侧
对称:略
左长尾(left skewed):中位数更靠近数据分布区间中心右侧,均值在中位数左侧
造成均值与中位数这种关系的原因在于均值位置的“加权”性质。
均值容易受极端值(少数的 极大或者极小的值)的影响,中值没有这种性质。