前面我们算是简单入门了Pandas,numpy也是数据分析中常用的,这里我们也来简单学习下。
1.numpy基本介绍
numpy是Python的一种开源数值计算扩展,这种工具可以用来存储和处理大型矩阵。
一个用Python实现的科学计算包。
from 百度百科
numpy有2种基本对象,
ndarray是存储单一数据类型的多维数组,ufunc是能够对数组进行处理的函数。
2.ndarray
我们先来看看这个数组
首先,我们得引入numpy
2.1 创建
数组初始化的话有很多方式:Array creation routines
我们可以直接使用list来初始化,array有很多的属性,比如大小,维度,元素个数
这里呢,我们定义了一维数组和二维数组,比如c,是3行3列的2维数组,元素个数是9个
这里,我们再说下这个shape,这个属性可以修改
这里需要注意下,如果某个轴的元素为-1,将根据数组元素的个数,自动计算长度
这里的shape是改变原来的数组,另一个method,可以创建一个改变shape的新数组,而原数组保持不变
这里要注意的是,c和d共享内存数据存储内存区域,c变了,d也会变
我们可以通过dtype来获取元素的类型,我们可以在初始化的时候,指定dtype
下面,我们来看看常用的初始化方法
arange
通过指定开始值,结束值和步长来创建一维数组,这里不包过终值
linspace
通过指定开始值,终值和元素个数,来创建数组,这里包括终值
np.zeros,np.ones
这2个函数可以初始化指定长度或形状的全0或全1的数组
np.empty
可以创建一个没有任何具体值得数组
这要注意下,empty初始化的都是没有意思的值,不一定会初始化为0
2.2 存取元素
这里直接粘贴一个例子,原始教程在这:http://old.sebug.net/paper/books/scipydoc/numpy_intro.html
就2维数组来说
这是基本的获取方式,还有些高级的方法
使用整数序列
这里简单来2个练习,原文例子很多,就是通过下标来筛选数据
3.附录(参考资料)
文档:
https://docs.scipy.org/doc/numpy-dev/reference/index.html#reference