平均值等于每个小矩形的面积(即概率)乘以每组横坐标的中点,然后相加。

对于平均值,首先要对直方图进行归一化处理,也就是说,所有矩形的面积之和为1,然后每个矩形的面积代表该数在其底边中点横坐标上出现的频率。那么面积乘以横坐标就相当于频率乘以横坐标,当然得到的是平均值。

频率直方图中没有样本数据。在某个分组中,找不到分布在这个分组中的样本数据,然后分布不均匀,就用这个分组中点的横坐标来表示这个分组样本数据的平均值。

每个小矩形的面积代表对应的频率(相当于对应数据的百分比),所以平均值等于每个小矩形的面积之和乘以对应组底部中点的横坐标。

频率分布直方图的应用

频数直方图可以清楚地显示各组的频数分布,很容易显示各组之间的频数差异。主要是为了直观形象的展示我们所获取的数据,让我们更好的了解数据的分布情况,所以组距和组数起着关键的作用。

如果组太少,数据会非常集中;如果组太多,数据会很分散,掩盖了分布的特点。当数据在100以内时,一般分为5~12组为宜。

可以从频率分布直方图中估计的几个数据:

众数:频率分布直方图中最高矩形底边中点的横坐标。

算术平均:频率分布直方图中每组值的平均值乘以频率并相加。

加权平均:加权平均是所有频率乘以数值的总和。

中位数:平行于Y轴的一条直线的横坐标,将频率分布直方图分成两个相等的部分。

示例分享