常见图表-直方图

常见图表介绍及实例

什么是直方图

直方图(Histogram)又称质量分布图。是一种统计报告图,由一系列高度不等的纵向条纹或线段表示数据分布的情况。 一般用横轴表示数据类型,纵轴表示分布情况。
为了构建直方图,第一步是将值的范围分段,即将整个值的范围分成一系列间隔,然后计算每个间隔中有多少值。 这些值通常被指定为连续的,不重叠的变量间隔。 间隔必须相邻,并且通常是(但不是必须的)相等的大小。

直方图一开始可能是应用在工业生产领域,来做质量评估,判断生产稳定性

组数:在统计数据时,我们把数据按照不同的范围分成几个组,分成的组的个数称为组数。
组距:每一组两个端点的差。

作用(优势)

  1. 显示数据波动状态
  2. 直观的表达数据分布趋势
  3. 方便找到应该关注的点

绘制方法

– from 百度百科

①集中和记录数据,求出其最大值和最小值。数据的数量应在100个以上,在数量不多的情况下,至少也应在 50个以上。 我们把分成组的个数称为组数,每一个组的两个端点的差称为组距。
②将数据分成若干组,并做好记号。分组的数量在5-12之间较为适宜。
③计算组距的宽度。用最大值和最小值之差去除组数,求出组距的宽度。
④计算各组的界限位。各组的界限位可以从第一组开始依次计算,第一组的下界为最小值减去最小测定单位的一半,第一组的上界为其下界值加上组距。第二组的下界限位为第一组的上界限值,第二组的下界限值加上组距,就是第二组的上界限位,依此类推。
⑤统计各组数据出现频数,作频数分布表。
⑥作直方图。以组距为底长,以频数为高,作各组的矩形图。

实例

假设我们有公司所有部门的KPI完成情况,如下图:

我们想要了解公司的整体运营情况,用图表来看会更直观,这就正好用上了直方图,来看公司在每一个区间的分布情况;
我们以0.3为组距,分成5个组(数据是随机生成的,貌似有点儿不太靠谱,如果公司的KPI完成率是这样,我觉得KPI定义会稍微有问题,基本上都没达标啊)
概率分布表

然后,我们在Excel中,创建一个图表,就可以直观的看到KPI的完成情况分布了
直方图

于贵洋 wechat
要教我弹吉他嘛!