渐变色简单易用 生成一个多元正态分布矩阵 参数mean : 均值 参数cov : 协方差, array类型 参数size: 个数 x, y = np.random.multivariate_normal(mean=[0, 0], cov=[[1, -.5], [-.5, 1]], size=300).Tpal = sns.dark_palette(“green”,as_cmap=True) as_cmap=True,返回一个colormap对象 sns.kdeplot(x, y, cmap=pal) kdeplot : 核密度估计图, #cmap=pal,以colormap方式来设置颜色
> 频数直方图 生成100个成标准正态分布的随机数 x = np.random.normal(size=100) sns.distplot画频数直方图 kde=True,进行核密度估计 sns.distplot(x,kde=True)
>散点图 一般用散点图展示两个变量间的关系 sns.jointplot(x=‘x’, y=‘y’, data=df, size=7) # x,y参数也可以用x=df[‘x’], y=df[‘y’] 的形式传入 sns.jointplot画双变量关系图, data传入dataframe,x,y设置两个变量数据, size设置图的大小
盒图(三变量:day,total_bill, time) sns.boxplot() 盒图是显示数据离散度的一种图形。它对于显示数据的离散的分布情况效果不错。 IQR = Q3-Q1,即上四分位数与下四分位数之间的差,也就是盒子的长度。 N = 1.5IQR 如果一个值>Q3+N或 < Q1-N,则为离群点 盒图特点: 通过盒图,在分析数据的时候,盒图能够有效地帮助我们识别数据的特征: 直观地识别数据集中的异常值(查看离群点)。 判断数据集的数据离散程度和偏向(观察盒子的长度,上下隔间的形状,以及胡须的长度)。 基本设置 plt.figure(figsize=(10,6)) plt.xticks(size=12) plt.yticks(size=12) plt.xlabel(‘day’,size=16) plt.ylabel( ‘total_bill’,size=16) sns.boxplot(x=“day”, y=“total_bill”, hue=“time”, data=tips)
小提琴图(三变量:day, total_bill, time) sns.violinplot()函数实现 plt.figure(figsize=(10,6)) plt.xticks(size=12) plt.yticks(size=12) plt.xlabel(‘total_bill’,size=16) plt.ylabel( ‘day’,size=16) sns.violinplot()画小提琴图 sns.violinplot(x=“total_bill”, y=“day”, hue=“time”, data=tips) 图中白点是中位数, #中间黑色盒形是上四分位点和下四分位点, #黑色的线条表示离群点的离群程度,越长表示离群点越远 plt.show()
sns.violinplot(x=“day”, y=“total_bill”, hue=“sex”, data=tips, split=True) plt.show()