案例: 垃圾邮件过滤
我们想知道,当一封邮件包含关键词“中奖”时,它到底有多大的可能性是垃圾邮件。
1. 设定先验概率
在所有邮件中,垃圾邮件的基础比例。
2. 设定似然度 (Likelihood)
垃圾邮件有多大概率会包含“中奖”这个词。
正常邮件有多大概率会“误含”这个词。
3. 查看后验概率
请拖动左侧滑块,观察下方韦恩图(面积正比于概率)的变化。
垃圾邮件 &
含“中奖”
含“中奖”
正常邮件 &
含“中奖”
含“中奖”
垃圾邮件 &
不含
不含
正常邮件 &
不含
不含
← 左侧: 包含关键词“中奖”的邮件 (P(含“中奖”)) →
P(垃圾邮件 | 含“中奖”) = ?
0.00%