Python
Pandas
这里整理下,pandas中数据加载的几个方法,前面,我们也有用过,read_csv,下面,我们整理下
1.pandas读取数据方法
|
|
我们可以看到这个参数非常多,基本上可以解决我们文件读取时的常见问题。
下面就是小例子
csv文件内容是这样的:数据以逗号分隔,没有其他特殊的情况
|
|
我们可以看到,这里默认把第一行当做columns了,我们可以通过header=None,来自动指定标题
现在的行索引是自动初始化的,我们可以指定存在的列为索引
比如,有这样一份数据,字段间是通过一个或多个空格来分隔的
我们直接使用read_csv去读取,会发现,列索引有些不友好,我们可以使用正则表达式去分隔
还有很多其他常用的参数,比如skiprows,可以跳过指定行
下面,再说个填充缺失值的方法,na_values可以将其他我们指定的值也当成NaN处理
#2.pandas导出数据
我们使用read_csv读取数据,处理完之后,我们可能还需要将数据存储起来,还有一个to_csv的函数
#3.附录
pandas中还有其他的加载数据方式,像读取HTML,JSON,xml等等,常用的可能还是和数据库取连接,这块后面会再补充,这里就先到这里。