pandas官方文档:https://pandas.pydata.org/pandas-docs/stable/?v=20190307135750
pandas基于Numpy,可以看成是处理文本或者表格数据。pandas中有两个主要的数据结构,其中Series数据结构类似于Numpy中的一维数组,DataFrame类似于多维表格数据结构。
pandas是python数据分析的核心模块。它主要提供了五大功能:
支持文件存取操作,支持数据库(sql)、html、json、pickle、csv(txt、excel)、sas、stata、hdf等。支持增删改查、切片、高阶函数、分组聚合等单表操作,以及和dict、list的互相转换。支持多表拼接合并操作。支持简单的绘图操作。支持简单的统计分析操作。Series是一种类似于一维数组的对象,由一组数据和一组与之相关的数据标签(索引)组成。
Series比较像列表(数组)和字典的结合体
import numpy as np import pandas as pd df = pd.Series(0, index=['a', 'b', 'c', 'd']) print(df)a 0 b 0 c 0 d 0 dtype: int64
print(df.values) print(df.index)[0 0 0 0]
ndex(['a', 'b', 'c', 'd'], dtype='object')
转载于:https://www.cnblogs.com/dadazunzhe/p/11403984.html
相关资源:pandas模块的常用