Python
Pandas
在数据分析中,时间序列应该很常见,这里,我们看看在pandas里面的使用
1. 日期和时间数据类型
经常使用的datetime,time,及calendar模块
datetime.timedelta表示2个datetime对象的时间差
|
|
我们可以给datetime加上或者减去一个或多个timedelta
2. 日期转换
|
|
dayfirst参数
我们可以将一个包含日期信息的DataFrame封装成datetime
这样转换的时候,是一定需要,最少满足年月日3列,不然会报错
ValueError: to assemble mappings requires at least that [year, month, day] be specified: [day,month] is missing
errors参数
如果一个日期不符合规范,默认是会报错的,我们可以通过errors参数来控制
这个NaT,就是Not a Time,在时间序列里面表示NA值
3. 时间序列基础
最基本的时间序列类型,就是以时间戳为索引的Series
不同索引的时间序列之间的算术运算会按时间自动对齐
4. 索引、选取、子集构造
对于时间序列的处理,有很方便的方式
对于DataFrame来说,也是一样的
|
|