提供: 1.提供便于操纵数据的数据类型 2.提供了分析函数的分析工具
Pandas基于NumPy实现,常与NumPy和Matplotlib一同使用。
理解 3.1.两个数据类型:Series(一维数据类型), DataFrame(二维到多维的数据类型) 3.2基于上述的数据类型的操作:基本操作、运算操作、特征类操作、关联类操作。
1.由一组数据及与之相关的数据索引组成。
Series对于对象中的每一个数据都会关联一个索引: 1.1数据由pandas自动生成,从零开始的数据; 1.2自定义索引:由用户给定。其中,当有两个参数时候,index可以省略不写,如下:
2.Series类型可以由以下类型创建:
Python列表,index与列表元素个数一致。
标量值(意为“一个值”),index表达Series类型的尺寸。
Python字典,键值对中的键是索引,index从字典中进行选择和操作。 Note:NaN表示None,空。
ndarray,索引和数据都可以通过naarray类型创建。
其他函数,range函数等。
3 基本操作
.index获得索引,.values获取值
Series类型的操作类似字典类型:
1.通过自定义索引访问 2.保留字“in”操作 3.使用.get()
4.Series类型对齐操作: 区别于numpy只关心数据的维度。
3.Series类型的name操作: Series对象和索引都可以有一个名字,存储在属性.name中。 4.Series类型可以随时修改并立即生效。 5.Series是一维带“标签”的数组,基本操作类似ndarray和字典,根据索引对齐。