Python重要模块

mac2025-05-21 79

Python重要模块（待整理）

一、基础模块

sys 模块函数/变量描述sys.exit([arg])退出当前程序sys.modules已导入的模块和模块名（返回一个字典）sys.path模块的目录的名称（返回一个列表）sys.platform平台标识符（如win32）

os模块函数/变量描述os.environ包含环境变量的映射os.sep路径中使用的分隔符（如windows是\\)os.pathsep分隔不同路径的分隔符os.linesep行分隔符os.system(command)在子shell中执行操作系统命令

fileinput 模块函数/变量描述fileinput.input([file[,inplace[,backup]]])迭代多个输入流中的行fileinput.filename()返回当前文件名称fileinput.lineno()返回累计的当前行号fileinput.filelineno()返回当前文件中的行号fileinput.isfirstline()检查当前行是否是文件第一行fileinput.nextfile()关闭当前文件并移到下一个fileinput.close()关闭

heapq（堆）模块函数/变量描述heapq.heappush(heap,x)将x压入堆中heapq.heappop(heap)从堆中弹出最下的元素heapq.heapify(heap)让列表具有堆的特征heapq.heapreplace(heap,x)弹出最小的元素，并将x压入堆中heapq.nlargest(n,iter)返回iter中n个最大的元素heapq.nsmallest(n,iter)返回iter中n个最小的元素

time 模块日期元组中的字段索引字段值0年如2000，20011月1-122日1-313时0-234分0-595秒0-616星期0-6，0是星期一7儒略日1-3668夏令时0，1，-1 函数函数/变量描述time.asctime([tuple])将时间元组转换为字符串time.localtime([secs])将秒数转换为表示当地时间的日期元组time.mktime(tuple)将时间元组转换为当地时间time.sleep(secs)休眠secs秒time.strptime{string[,format])将字符串转换为时间元组time.time()当前时间

6. random 模块

函数/变量描述random.random()返回一个0-1的随机实数random.getrandbits(b)以长整数方式返回n个随机的二进制位random.uniform(a,b)返回一个a-b的随机实数random.randrange([start],stop,[step])random.choice(seq)random.shuffle(seq[,random])random.sample(seq,n)

7. re 模块（正则表达式）

函数/方法描述re.compile(pattern[,flags])将用字符串表达的正则表达式转换为模式对象re.search(pattern.string[,flags])在字符串中查找对应的模式re.match(pattern.string[,flags])在字符串开头匹配模式re.split(pattern,string[maxsplit=0])根据模式分割字符串re.findall(pattern,string)返回一个列表，包含字符串中所有与模式匹配的字符串re.sub(pat,repl,string[,count=0])将字符串中与模式匹配的字符串换成replre.escape(string)转义字符串在所有正则表达式的特殊字符object1.group([group1,…])通常先用match方法进行，返回与模式中给定编组匹配的子串，没有指定在默认为0object1.start([group])返回与给定编组匹配的字符串的起始索引object1.end([group])返回与给定编组匹配的字符串的结束索引+1object1.span([group])返回与给定编组匹配的字符串的起始索引和结束索引+1

8. operator 模块（运算符） 9. math 模块

二、进阶模块

NumPy模块（处理存储大型矩阵数组）创建数组 (简化numpy名为np） import numpy as np arr1=np.array([1,2,3])#通过列表创建数组 arr2=np.array([(1,2,3),(2,3)])#通过元组创建数组 arr3=np.zeros((m,n))#通过元组创建零矩阵(m行n列） arr4=np.identity(n)#生产n维的单位矩阵 arr5=np.random.rand(m,n)#生产每个元素在[0,1]的随机矩阵(m行n列） arr6=np.arange(起点，终点，步长值)#从起点开始，以步长为间隔生产一个等距序列（不含终点值） arr7=np.linspace(起点，终点，n)#将起点和终点间的距离平均分成n个数值，生成等距序列（包含起点和终点值）访问数组，矩阵方法描述arr1.shape返回矩阵的规格arr1.ndim返回矩阵的秩arr1.size返回矩阵元素总数arr1.dtype.name返回矩阵元素的数据类型type(arr1)返回整个数组对象的类型索引切片 arr1[m,n]#返回第m行，第n列的元素（下标从0开始） arr1[m:n,x:y]#切片，返回m到n行，x到y列的元素 arr1[:,y]#切片，返回矩阵第y列 arr1[-1]#切片，返回矩阵最后一行运算与其他函数运算描述+，-，*，**返回加法，减法，普通乘法和幂运算（如arry1-arry2)np.dot(arr1,arr2）矩阵乘法arr1.T转置arr1.I求逆矩阵np.linalg.inv(arr1)返回逆矩阵（结果同上）arr1.sum()数组元素求和arr1.max()返回数组元素最大值arr1.cumsum(axis=1)按行累计总和arr1.shape或arr1,shape(0)等返回一个元组显示该数组的大小np.tile(A,B)将A数组重复B次（B可以是一个元组，表示行/列重复次数arr1.argsort()将数组从小到大排列后，返回其索引通用函数、合并与分割函数描述np.exp(arr1)指数函数np.sin(arr1)正弦函数np.sqrt(arr1)开方np.add(arr1)加法（等同于+）np.vstack((arr1,arr2))纵向合并数组np,hstack((arr1,arr2))横向合并数组np.hsplit(arr1,n)横向分为n部分np.vsplit(arr1,n)纵向分为n部分其他常用方法函数描述np.empty((m,n))返回一个给定规模的数组np.all(array)测试数组元素是否均为Truenp.any(array)测试数组元素是否至少有一个为Truenp.average(array,axis,weights)计算加权平均值np.nonzero返回数组非0元素的位置np.sort对数组元素进行排序np.var计算方差np.where返回数组满足条件的元素np.reshape转换数组的规模np.eye生产单位矩阵np.transpose转置，等同于.Tnp.std计算标准差np.cov计算协方差矩阵

其他：numpy库的其他介绍. 2. Pandas模块（分析复杂的数据）

创建数据框(简称pandas为pd） import pandas as pd df=pd.DataFrame(数据集名,columns=['a','b'],index=list2) #DataFrame不能小写，数据集一般为字典或NumPy数组 df['a'] #获取数据框某一列创建系列与向量化操作 df=pd.Series(数据集名,name) #Series不能小写，数据集一般为字典或NumPy数组 df['a']或df[:3] #获取数据框某一或几列 import numpy as np print(np.sqrt(df)) df['d']=df['a']>1 #数据框的增常用方法方法描述pd.read_csv()将.csv文件中的数据读入内存，快速构建数据框pd.concat()按横向或纵向合并两个Pandas数据结构pd.get_dummies将类别变量转变为独热编码Series.isnull判断系列中所有值是否含有空值Series.is_unique判断系列中所有值是否重复Series.value_counts()统计系列中所有取值的出现次数DataFrame.mean()按行或列分别计算平均值DataFrame.dropna()删除所有缺失数据的行或列DataFrame.drop_duplicates()删除所有重复的行DataFrame.head()默认返回数据框中的前五行DataFrame.tail()默认返回数据框中的后五行

3. scikit-learn模块（机器学习） 4. Matplotlib模块（绘图）

import matplotlib.pyplot as plt plt.scatter(x, y,s=shapesize,c=color,marker="散点的形状") plt.title("标题") plt.xlabel("行标题") plt.ylabel("列标题") plt.savefig("路径")#存图路径 plt.show()

最新回复(0)