概率论基础模型(用到多少,学多少 =_=)
Question One: What's the mean of Bayesian inference ?
“推理”(inference)是指“从样本数据出发,得出带有一定置信度的一般性结论的行为”。术语“贝叶斯”(Bayesian)则用来指代那些使用概率理论来表示“置信度”(即确定程度)并利用 贝叶斯公式(Bayes’ rule) 根据观察数据更新置信度的方法。

贝叶斯公式本身非常简单:它是一个用于计算在给定观测数据 情况下,某个未知(或隐藏)变量 可能取值的概率分布的公式:
这个公式可以由以下恒等式直接推出:
而这个恒等式又来自于概率的乘法法则(product rule)。
在公式 (2.51) 中,术语 表示在我们看到任何数据之前,对 的可能取值的了解;这被称为先验分布(prior distribution)。如果 有 个可能的取值,那么 就是一个包含 个元素的向量,其中的概率和为 1。
术语 表示在假设 的前提下,我们对可能出现的结果 的分布,这被称为观测分布(observation distribution)。当我们将其评估于实际观测结果 上时,就得到了函数 ,这被称为似然函数(likelihood)。需要注意的是,这其实是 的函数,因为 是已知的固定值,并且它不是一个概率分布,因为它的和不一定为 1 。
将先验概率 与似然函数 相乘,可以得到未归一化的联合分布 。我们可以通过除以 将其变为归一化分布,这个除数被称为边际似然(marginal likelihood),因为它是通过对未知量 进行边际化(即求和)得到的:
通过对每个 计算 ,我们就得到了后验分布(posterior distribution),它表示我们在看到数据 之后,对 可能取值的最新信念状态。
我们可以用一句话来总结贝叶斯公式:
这里使用符号 (“正比于”)表示我们省略了分母,因为它只是一个与 无关的常数。
使用贝叶斯公式,根据观测数据对某一感兴趣的未知量的分布进行更新的过程,被称为贝叶斯推理(Bayesian inference)或后验推理(posterior inference),也可以简称为概率推理(probabilistic inference)。
Bayes 公式人话版本: “先有预期 + 接收信息 → 更新判断”
:隐藏的“真相”或假设
:你观测到的信息
:你在没有观察任何信息前对 H 的先验信念
:如果 H 是真的,你会看到这个信息的可能性
:你在看到 Y 后对 H 的新判断(后验)
概率论的核心是:在已知世界状态 的前提下,预测某个结果 的分布。而逆概率问题关注的则是:通过观察结果 ,去推断世界的状态 。我们可以把这看作是对 映射关系的反向求解。

举个例子,设想我们要从一张二维图像 中推断出一个三维形状 。这是视觉场景理解中的一个经典问题。不幸的是,这是一个根本上的病态问题(ill-posed problem),如图 2.8 所示:同一个观测结果 ,可能对应多个潜在的隐藏状态 。同样地,我们也可以将自然语言理解看作是一个病态问题:听者必须从说话者表达出的(通常是模糊的)语言中,去推测其真正的意图 。
为了解决这类反向问题,我们可以使用贝叶斯公式来计算后验概率 ,它描述了在观测到 的情况下,对各种可能世界状态 的概率分布。
要实现这一点,需要给出: