Seaborn - 内核密度估计


核密度估计(KDE)是一种估计连续随机变量的概率密度函数的方法。它用于非参数分析。

在distplot中将hist标志设置为 False将生成核密度估计图。

例子

import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('iris')
sb.distplot(df['petal_length'],hist=False)
plt.show()

输出

图形

拟合参数分布

distplot()用于可视化数据集的参数分布。

例子

import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('iris')
sb.distplot(df['petal_length'])
plt.show()

输出

直方图

绘制二元分布图

双变量分布用于确定两个变量之间的关系。这主要处理两个变量之间的关系以及一个变量相对于另一个变量的Behave方式。

在seaborn中分析双变量分布的最佳方法是使用jointplot()函数。

Jointplot 创建一个多面板图形,用于投影两个变量之间的双变量关系以及每个变量在不同轴上的单变量分布。

散点图

散点图是可视化分布的最便捷方法,其中每个观测值通过 x 和 y 轴以二维图表示。

例子

import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('iris')
sb.jointplot(x = 'petal_length',y = 'petal_width',data = df)
plt.show()

输出

条形图和直方图

上图展示了Iris数据中petal_lengthpetal_width之间的关系。图中的趋势表明所研究的变量之间存在正相关。

六边形图

当数据密度稀疏时,即当数据非常分散且难以通过散点图进行分析时,六边形分箱用于双变量数据分析。

称为“kind”的加法参数和值“hex”绘制十六进制图。

例子

import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('iris')
sb.jointplot(x = 'petal_length',y = 'petal_width',data = df,kind = 'hex')
plt.show()
六边形和酒吧

核密度估计

核密度估计是估计变量分布的非参数方法。在seaborn中,我们可以使用jointplot()绘制kde

将值“kde”传递给参数 kind 以绘制核图。

例子

import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('iris')
sb.jointplot(x = 'petal_length',y = 'petal_width',data = df,kind = 'hex')
plt.show()

输出

X射线