Python
Pandas
序
这里主要介绍下,在DataFrame中一些筛选的操作,常用的有下面这些
熟练掌握上面的几个方法,操作DataFrame应该就足够了
Python
Pandas
这里主要介绍下,在DataFrame中一些筛选的操作,常用的有下面这些
熟练掌握上面的几个方法,操作DataFrame应该就足够了
Python
Pandas
DataFrame是2维的标签数组,可以把他当成电子表格(Excel),数据库里的表,a dict of Series。
DataFrame初始化,也可以有不同的输入,
在Series中呢,我们有一个index的概念,在DataFrame中,我们除了index,还有一个columns的概念
index:行标签
columns:列标签
|
|
我们看到,这里有data,index,columns
我们可以只初始化data,其他都默认
我们看到,index,依然是下标从0开始,columns呢,也是从0开始的
我们可以,初始化index,和columns
Python
Pandas
要学习pandas了,,看官网上的资料还是很多的,就根据找到的资料简单总结下吧。
这里也有很多同学分享的资料,这里都整理下,按照自己的理解整理下。
这里的主要内容,参考官方教程:
http://pandas.pydata.org/pandas-docs/stable/dsintro.html#dsintro
pandas里面有3个基本的数据结构,
我们可以把Series,理解成一维数组,但是又和常规的一维数组不太一样。
Series是一维的标签数组,可以存储任意的数据类型(integers,strings,floating point numbers,Python objs,etc.)
这里为什么是标签数组呢?因为他多了一个轴的概念,类似索引,我们往下看下就知道了。
引入必要的类
基本初始化语法:
这个data,就是我们要初始化的数据,index,就是那个标签了,即索引
data呢,常规可以为:
昨天在看水足迹那个可视化题目的时候,就想做一个堆叠条形图,但是发现只有一个维度,怎么也拖不出来,后来改了下数据源,成功实现了。今天搜到个例子,发现了解决办法,只能说明,还是对Tableau不熟啊,没有能领悟Tableau的内涵。
教程中介绍了2种方法,我们都来实践一下。这里面,最大的收获,就是原来那个“度量名称”和“度量值”是可以拖拽过去使用的,我也是醉了,这个操作得好好研究下,理解下Tableau的机制。
这里的度量名称,应该就是所有度量的一个集合;度量值应该就是“度量名称”集合中选定的度量。
这里我们就用 http://www.makeovermonday.co.uk/ 上的数据