于贵洋的博客

BI、数据分析


  • 首页

  • 分类

  • 标签

  • 归档

  • 站点地图

  • 公益404

  • 关于

  • 搜索

Pandas手册(3)- DataFrame-Selection By Label/Position

发表于 2017-07-31 | 分类于 Python-Pandas

Python
Pandas


序

这里主要介绍下,在DataFrame中一些筛选的操作,常用的有下面这些

熟练掌握上面的几个方法,操作DataFrame应该就足够了

1
2
3
4
5
6
7
8
9
10
11
12
import pandas as pd
import numpy as np
d = {'one' : pd.Series([1., 2., 3.], index=['a', 'b', 'c']),
'two' : pd.Series([1., 2., 3., 4.], index=['a', 'b', 'c', 'd'])}
df = pd.DataFrame(d)
print('原始数据:\n',df)
print('index 为a的数据:\n',df.loc['a'])
print('index下标为2的数据:\n', df.iloc[2])

阅读全文 »

Pandas手册(2)- DataFrame

发表于 2017-07-31 | 分类于 Python-Pandas

Python
Pandas


序

DataFrame是2维的标签数组,可以把他当成电子表格(Excel),数据库里的表,a dict of Series。
DataFrame初始化,也可以有不同的输入,

在Series中呢,我们有一个index的概念,在DataFrame中,我们除了index,还有一个columns的概念
index:行标签
columns:列标签

DataFrame初始化

1
class pandas.DataFrame(data=None, index=None, columns=None, dtype=None, copy=False)

我们看到,这里有data,index,columns
我们可以只初始化data,其他都默认

1
2
3
4
5
6
import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.randn(5))
print(df)

我们看到,index,依然是下标从0开始,columns呢,也是从0开始的
我们可以,初始化index,和columns

1
2
df = pd.DataFrame(np.random.randn(5),index=['i1','i2','i3','i4','i5'],
columns=['a'])

阅读全文 »

Pandas手册(1)- Series

发表于 2017-07-30 | 分类于 Python-Pandas

Python
Pandas


要学习pandas了,,看官网上的资料还是很多的,就根据找到的资料简单总结下吧。
这里也有很多同学分享的资料,这里都整理下,按照自己的理解整理下。

序

这里的主要内容,参考官方教程:
http://pandas.pydata.org/pandas-docs/stable/dsintro.html#dsintro
pandas里面有3个基本的数据结构,

我们可以把Series,理解成一维数组,但是又和常规的一维数组不太一样。
Series是一维的标签数组,可以存储任意的数据类型(integers,strings,floating point numbers,Python objs,etc.)
这里为什么是标签数组呢?因为他多了一个轴的概念,类似索引,我们往下看下就知道了。

Series初始化

引入必要的类

1
2
import pandas as pd
import numpy as np

基本初始化语法:

1
s = pd.Series(data, index=index)

这个data,就是我们要初始化的数据,index,就是那个标签了,即索引
data呢,常规可以为:

阅读全文 »

小白学习Tableau-堆叠条按值排序

发表于 2017-07-30 | 分类于 Tableau

序

昨天学习了下堆叠条形图,刚刚看到个类似的教程,说的是,在堆叠条中按值进行排序,挺有意思的。

又学习到了一招,简单分享下。

按值在堆叠条中对段进行排序

我们先实现一个简单的堆叠条,

  • 使用维度:地区、类别
  • 使用度量:销售额

Tableau-handbook-03-01

阅读全文 »

小白学习Tableau-堆叠条形图

发表于 2017-07-30 | 分类于 Tableau

序

昨天在看水足迹那个可视化题目的时候,就想做一个堆叠条形图,但是发现只有一个维度,怎么也拖不出来,后来改了下数据源,成功实现了。今天搜到个例子,发现了解决办法,只能说明,还是对Tableau不熟啊,没有能领悟Tableau的内涵。

堆叠条形图

教程中介绍了2种方法,我们都来实践一下。这里面,最大的收获,就是原来那个“度量名称”和“度量值”是可以拖拽过去使用的,我也是醉了,这个操作得好好研究下,理解下Tableau的机制。

这里的度量名称,应该就是所有度量的一个集合;度量值应该就是“度量名称”集合中选定的度量。

这里我们就用 http://www.makeovermonday.co.uk/ 上的数据

Tableau-handbook-02-01

阅读全文 »
1…171819…23
于贵洋

于贵洋

111 日志
17 分类
30 标签
RSS
GitHub
友情链接
  • 很久之前的CSDN博客
0%
© 2017 于贵洋
由 Hexo 强力驱动
|
主题 — NexT.Pisces v5.1.3
Hosted by GitHub Pages
本站访客数 人次 本站总访问量 次