朴素贝叶斯问题举例

mac2026-03-01 16

假设我们现在有垃圾邮件样本、正常邮件样本、测试邮件，其中

垃圾邮件样本： 1.点击、更多、信息 2.最新、产品 3. 信息、点击、链接

正常邮件样本： 1.开会 2.信息、详见、邮件 3.最新、信息

测试邮件：最新、产品、实惠、点击、链接

下面是计算步骤。

1 条件概率

注: 红色字体为平滑操作

$\frac{2+\color{red}{1}}{8+\color{red}{9}} = \frac{3}{17}$ 　　　　　　 $\frac{0+\color{red}{1}}{6+\color{red}{9}} = \frac{1}{15}$

$\frac{1+\color{red}{1}}{8+\color{red}{9}} = \frac{2}{17}$ 　　　　　　 $\frac{0+\color{red}{1}}{6+\color{red}{9}} = \frac{1}{15}$

$\frac{2+\color{red}{1}}{8+\color{red}{9}} = \frac{3}{17}$ 　　　　　　 $\frac{2+\color{red}{1}}{6+\color{red}{9}} = \frac{3}{15}$

$\frac{3}{17}$ 　　　　　　　　　 $\frac{1}{15}$

$\frac{2}{17}$ 　　　　　　　　　 $\frac{1}{15}$

$\frac{1}{17}$ 　　　　　　　　　 $\frac{2}{15}$

$\frac{2}{17}$ 　　　　　　　　　 $\frac{1}{15}$

2 先验概率

$\frac12$ 　　 $\frac12$

3 计算

$\frac{P(新邮件|正常)×P(正常) }{P(新邮件)}\\ \\ \\ = \frac{P(最新|正常)×P(产品|正常)×P(点击|正常)×P(链接|正常)×P(正常)}{P(新邮件)} \\ \\ = \frac{ \frac{2}{15}× \frac{1}{15}× \frac{1}{15}× \frac{1}{15}× \frac{1}{2} }{P(新邮件)}$ 注:

由于 “实惠” 未出现在样本中,因此第二个等号中缺少 P(实惠|正常)实际上第二个等号应为约等号P(新邮件)为标准化常量,难以计算

同理可计算出 P(垃圾|新邮件),将二者比较即可得出预测结果

最新回复(0)