常见图表-散点图

常见图表介绍及实例

发现一篇文档讲的很好,这里基本都是摘录,原文请参见附录

什么是散点图

散点图也叫 X-Y 图,它将所有的数据以点的形式展现在直角坐标系上,以显示变量之间的相互影响程度,点的位置由变量的数值决定。

通过观察散点图上数据点的分布情况,我们可以推断出变量间的相关性。如果变量之间不存在相互关系,那么在散点图上就会表现为随机分布的离散的点,如果存在某种相关性,那么大部分的数据点就会相对密集并以某种趋势呈现。数据的相关关系主要分为:正相关(两个变量值同时增长)、负相关(一个变量值增加另一个变量值下降)、不相关、线性相关、指数相关等,表现在散点图上的大致分布如下图所示。那些离点集群较远的点我们称为离群点或者异常点。

散点图经常与回归线(就是最准确地贯穿所有点的线)结合使用,归纳分析现有数据以进行预测分析。

对于那些变量之间存在密切关系,但是这些关系又不像数学公式和物理公式那样能够精确表达的,散点图是一种很好的图形工具。但是在分析过程中需要注意,这两个变量之间的相关性并不等同于确定的因果关系,也可能需要考虑其他的影响因素。

英文名:Scatter graph, Point graph, X-Y plot, Scatter chart or Scattergram

散点图应用场景

散点图通常用于显示和比较数值,不光可以显示趋势,还能显示数据集群的形状,以及在数据云团中各数据点的关系。

常见的是身高和体重的数据
从网上找一份身高体重的数据,

然后,我们选中身高和体重,插入一个散点图

通过观察,很容易发现,身高和体重是正相关的,而且是线性相关,及身高越高,体重越重

我们可以添加趋势线,并显示公式

当然,我们还可以在添加一个性别维度去看

这里我们要分别选择数据源,在Excel中,需要先制作男生的散点图,然后添加数据源,增加列,然后使用不同的图形表示就好了

好了,上面,我们简单了解了散点图,知道在Excel中简单制作散点图了,先到这里。

散点图的变形-气泡图

上面的散点图,只有2个变量,身高和体重,那如果我们想要再增加变量呢?比如说年龄,我们就可以用点的大小来表示年龄,这就变成了有大有小的点,像气泡一样,所以叫气泡图。

这里主要是在Excel中,选择不同的数据源即可,我们用年龄来控制大小

散点图的变形-分类矩阵

我们在绘制了散点图之后,通过添加辅助线可以进行决策,类似于波士顿矩阵

这主要是一种投资策略,通过这个图,可以快速的了解每种产品所处的价值区间,在Excel中,我们也可以简单的模拟这种图

上图是通过在数据区,填充了一个图片完成的,这里主要是要设置不同区间的阈值,这需要深入了解业务。

附录

以上内容参考: https://antv.alipay.com/vis/doc/chart/details/scatter-plot.html

于贵洋 wechat
要教我弹吉他嘛!