Tableau实例
关于购物篮的介绍可以参考数据分析案例-购物篮分析
目标
我们想要分析的是顾客在购买商品的时候,哪些商品会同时购买。
下面,我们直接开始开发Tableau
数据源
我们就是用Tableau默认自带的“示例-超市”
拖入两张订单表
因为我们需要分析的是每个顾客,在购买A商品的时候,还会购买哪些商品。只使用一张订单表,不是很容易看出来,所以我们需要拖入2张订单表,以此来更方便的处理数据。
因为我们要分析的是每个顾客,所以我们使用顾客ID去关联
Tableau实例
关于购物篮的介绍可以参考数据分析案例-购物篮分析
我们想要分析的是顾客在购买商品的时候,哪些商品会同时购买。
下面,我们直接开始开发Tableau
我们就是用Tableau默认自带的“示例-超市”
因为我们需要分析的是每个顾客,在购买A商品的时候,还会购买哪些商品。只使用一张订单表,不是很容易看出来,所以我们需要拖入2张订单表,以此来更方便的处理数据。
因为我们要分析的是每个顾客,所以我们使用顾客ID去关联
这里简单整理下,lambda表达式相关内容。
lambda表达式,是一个匿名函数,用起来方便快捷一些
这里,一个简单的加1的函数,看起来也很直观
这是x+y的函数,的确简洁很多
看网上,提到lambda表达式的话,都会提到函数式编程,一些常用的函数,像map,reduce,filter,sorted,
map是Python内置的一个函数,接收2个参数,一个函数,一个或多个可迭代参数
|
|
我们定义了一个函数,对传入的参数加10,一个list
map把这个函数,作用在每一个list的元素上,
这里呢,我们就可以用lambda表达式写,方便又直观
我们也可以传2个list,这里会计算2个list的和
reduce会将function作用于sequence,function接收2个参数
|
|
看名字,就是一个过滤的功能,对每个item调用function,只返回为True的
|
|
Python
Pandas
发现了一篇很好的教程,介绍一些Excel中的常用操作,怎样在pandas中实现,很不错,这里学习,顺便分享下。
原文地址:用Pandas完成Excel中常见的任务,
这个是翻译的,再原文是:Common Excel Tasks Demonstrated in Pandas
好了,下面,我们开始学习下。
这个是从网上找的一个成绩单,拿了一部分数据
首先呢,我们想要,在加一列,显示总分,Excel中很方便
在pandas中呢,其实,我们就是需要“数学”,“语文”,“英语”这3列加在一起,我们怎样获取这3列呢?
前面,我们说过在DataFrame中,怎样去筛选数据
|
|
刚刚在练习pandas的时候,遇到一个格式化的问题,没有太理解,百度了下,这里整理下。
str.format(),是一个格式化字符串的函数,很强大
str.format(args, *kwargs)
主要是使用 {}和:
这里直接就复制过来了,我们可以通过参数的位置来输出
我们也可以通过key,value的形式来格式化
填充与对齐
|
|
数值精度
这个说的挺全的,直接截图来吧
参考资料:
Python format 格式化函数
官方介绍:Format String Syntax
飘逸的python - 增强的格式化字符串format函数
Python
Pandas
前几天看了篇教程:使用Pandas对数据进行筛选和排序
里面主要介绍了,我们在使用Pandas时,对数据进行筛选和排序的介绍
这里简单总结分享下自己。
可能是版本的问题,原文中的sort函数没有了,变成了2个常用的函数 sort_index和sort_value
|
|
sort_index:按照索引排序,及列标签或行标签,axis=0是列标签,axis=1是行标签
sort_value:按值进行排序,这个估计用的会多些,按数据内容进行排序