codeye
2023/04/30阅读:11主题:默认主题
关于贝叶斯的一切:为什么个人对相似证据的评价不同?
关于贝叶斯的一切:为什么个人对相似证据的评价不同?
世界本质上是模棱两可的,面对不确定性,我们通常必须在日常生活中做出决定和判断。有些情况是微不足道的,例如,我应该带雨伞吗?我可以从抓娃娃机抓到奖品吗?
有些可能会产生严重的后果,例如,我应该同意大手术吗?我应该接种 covid-19 疫苗吗?
在这种情况下,概率通常会指导我们的决策。本文介绍了贝叶斯推理如何帮助我们推理日常问题,并解释了为什么不同的人对相似证据的评价不同。
概率
我们中的许多人应该熟悉概率的概念,它指的是事件发生的可能性。任何事件的概率都可以通过将感兴趣的事件数除以可能结果的总数来简单地计算。
例如,在6面掷骰子中获得 4 的概率是 1/6。假设骰子是公平的,这意味着您希望每六次掷出 4 次。
当参数已知时,概率的计算相对容易。但是,对于我们日常生活中的许多情况,通常并非如此,在这些情况下,我们不知道参数。
例如,与掷骰子的例子相比,从爪子机中奖的概率更难确定。通常,这些机器具有玩家不知道的操作员可调支付率。那么,我们如何确定从爪机获得奖品的概率?
我们可能会检查 n 次试验并记录玩家成功赢得奖品的次数。例如,我们可能会观察到一名玩家在总共 2 次试验中设法赢得了 25 个奖项。鉴于这样的观察,我们可以推断获胜的概率是 2/25 或 8%。

概率密度函数和累积分布函数图
我们还可以使用 beta 分布将概率建模为连续统一体。
β 分布是概率的概率分布,使用两个参数定义:α 和 β。在此插图的上下文中,α是指从爪机中奖的次数是2次,β表示未中奖的次数即 23 次。
上图显示了 beta 分布的概率密度函数和累积分布函数。左图告诉我们,大部分图的密度小于 0.2,我们可以使用右图估计胜率的 95% 置信区间大约在 1% 到 21% 之间。
这些数字强烈表明,从这台爪机中奖的实际可能性是 20% 或更低。虽然无法推断出真实的胜率,但这两个图肯定提供了比离散概率值更多的信息。
这种观察数据并确定事件发生概率的方法在学术界普遍使用,并在学校教授。这种对概率的解释也被称为频率主义推理。根据维基百科的定义,这种推理方法“通过强调数据的频率或比例从样本数据中得出结论”。
虽然这可能是量化不确定性和可能性的客观方法,但它与我们日常生活中的行为和推理方式不一致。例如,鉴于我们计算出的赢得上述爪机的概率,有些人可能会决定冒险,而另一些人尽管看到相同的证据,但仍会避免冒险。频率主义学派的局限性在于缺乏对不同个体之间不同先前信仰的解释。
贝叶斯推理:量化和更新我们的信念
在我们的日常生活中,概率不仅用于描述数据,还用于量化我们对世界事物的信念强度。例如,我认为明天太阳可能会升起,我相信十年后公司仍然存在。
当我们体验新事物和观察新证据时,我们的信念会不断变化。另一种思想流派,贝叶斯推理,恰恰反映了量化和更新我们信念的过程。
“贝叶斯”一词起源于英国统计学家和长老会牧师托马斯·贝叶斯。他设计了贝叶斯定理,这是一个由以下公式定义的条件概率概念。
P(A|B) 是指在事件 B 已经发生的情况下事件 A 发生的概率。贝叶斯定理声称我们可以计算出P(B|A) 如果我们知道反向条件概率: P(A|B)

贝叶斯定理
使用贝叶斯定理进行基于主观概率的推理的方法是由法国学者皮埃尔-西蒙·拉普拉斯推广的。这种推理方法被称为贝叶斯推理,它表达了假设的概率或信念状态应该如何根据新证据而改变。
现在,让我们使贝叶斯定理适应假设(H) 和观察到的证据(E) 的上下文。

贝叶斯定理在贝叶斯推理中的应用
在贝叶斯推理的上下文中,P(H|E) 被称为后验概率,它表示我们在观察到的证据下对假设的信念有多坚定。
这可以使用两个关键组件推导出来:可能性和先验概率。
首先,可能性 P(E|H) 代表给定我们假设的证据的概率。这类似于我们使用频率主义方法计算概率的方式。
其次,先验概率 P(H) 表示我们在观察证据之前对假设的信念强度。这是区分频率推理和贝叶斯推理方法的关键组成部分。
最后,我们需要 P(E) 将我们的后验概率归一化为 0 到 1 之间的值。
示例:如果您的抗原快速检测呈阳性,Covid-19 感染的概率是多少?
假设您在新加坡使用抗原快速检测 (ART) 检测出 Covid-19 感染呈阳性。正如新闻报道的那样,ART的敏感性(真阳性率)为82%,其特异性(真阴性率)为99%。这也表明误报率为 1%。
鉴于我们用谷歌搜索发现新加坡的 Covid-19 感染率目前约为 1%,如果您接受阳性拭子测试,感染的概率是多少?

上表告诉我们,在考虑到我们之前认为感染率为 45% 后,感染的概率为 3.1%。这个例子还突出了频率主义方法和贝叶斯方法之间的推理差异。
如果我们不考虑任何先验概率,我们会假设感染的可能性相当于 82% 的可能性,因为这是测试的真正阳性率。
现在,让我们检查如果我们有不同的先验概率,则后验概率的差异。
例如,如果有人假设感染率更高到 5%,那么拭子检测呈阳性,感染的概率是多少?

如新表所示,新的后验概率增加到81.2%。鉴于相同的证据,与先前概率较低的人相比,先验概率较高的人更确定感染。这可能会对心理健康产生影响,因为恐惧和焦虑水平可能在45%和81%的感染几率之间。
更新我们的信念
贝叶斯推理的核心是在收集新证据时更新我们的信念的概念。重要的是,这是一个持续的过程。让我们更进一步,假设我们第二次接受 ART 并再次检测呈阳性。我们新的后验概率是多少?

我们根据第一个测试结果将先验概率更改为 45.3%,并再次计算后验概率。上表告诉我们,更新的感染几率是98.5%。显然,我们应该立即去医院!
先前的信念很重要
贝叶斯定理的使用证明了先验信念在评估相同证据方面的重要性。我们对世界的许多信念和假设因人而异。如示例中所示,不同的先验信念可能导致对比的后验概率。
这合理地解释了为什么个人对相似证据的评估不同,从而有不同的行为。因此,重要的是要注意,概率不仅描述随机性,还表达个人信念的力量,它们的相互作用为我们在日常生活中的决定和判断提供了信息。
作者介绍