数据可视化

mac2022-08-06  41

数据可视化

import pandas as pd df=pd.read_csv(r'C:\Users\Administrator\Desktop\project\appstore_games.csv') df

1、df.describe()

#输入所有的列都在输出中, df.describe(include='all') #count:计数,这一组数据中包含的数据个数 #mean:平均值,这一组数据的平均值 #std:标准差,这一组数据的标准差 #top:数据中出现次数最高的值 #unique:表示有多少种不同的值 #freq:出现次数最高的那个值的(top)的出现频率 #50%:中位数

2、缺失值的可视化

#check missing data 可视化缺失值的情况 import missingno as msno # check missing value #missingno提供了一个小的工具集,它提供了灵活且易于使用的缺失数据可视化和实用工具,允许您快速获得 #数据集完整性(或缺失性)的可视化摘要。 msno.matrix(data)

msno.bar(data)

3、制作WordCloud

from wordcloud import WordCloud fig,ax=plt.subplots(1,2,figsize=(16,32)) worldcloud=WordCloud(background_color='white',width=800,height=800).generate(' '.join(data['Name'])) worldcloud_sub=WordCloud(background_color='white',width=800,height=800).generate(' '.join(data['Subtitle'].dropna() .astype(str))) ax[0].imshow(worldcloud) ax[0].axis('off')#关闭坐标轴 ax[0].set_title('Worldcloud(Name)')#设置标题 ax[1].imshow(worldcloud) ax[1].axis('off') ax[1].set_title('Worldcloud(Subtitle)') plt.show()

最新回复(0)