当前位置: 首页 > 技术突破

贝叶斯推理,学习和AI系统开发

时间:2024-02-27 18:16:52 技术突破

  现在,正在使用鲜为人知的数学公式来帮助解决广泛的问题,包括对大流行的传播方式以及我们智能手机上的其他用途的预测。本文解释了原因。

  大约35年前,当我第一次开始在AI工作时,我对一种技术的应用使我眼花azz乱。它被称为贝叶斯推论 - 基于18世纪神职人员托马斯·贝叶斯(Thomas Bayes)构想的数学公式。它被称为贝叶斯定理。它非常成功地用于专家系统 - 1980年代AI的成功分支。令我震惊的是,数学公式可以模仿人类的决策过程中的专家,并改善了数学公式的方式。

T. Bayes牧师:Barrett开发的柱状方法的改良剂。资料来源:Wikimedia

  作为一名研究生数学家,我熟悉并使用过其他类型的解决问题的贝叶斯定理。但是它在模拟人类专家中的使用对我来说是新的。我发现这令人印象深刻,因为人类专家不太可能了解贝叶斯定理的数学知识。今天,它在AI世界中无处不在。我们都在智能手机上使用它而没有意识到它。在当今的机器学习系统中,贝叶斯推断比以往任何时候都更为突出。

  为什么?答案是,鉴于正确的条件,贝叶斯推论似乎可以很好地对人类的专业知识进行特殊的构想。那怎么可能?答案是,专家下意识地学会了将合理正确的权重分配给证据,以使他们能够在解决问题的情况下进行直观的计算。但是贝叶斯公式可以精确地进行此类计算。

  贝叶斯定理 - 如何工作

  为了了解其工作原理,我们使用符号符号来描述贝叶斯中的问题,如下所示:

  首先,应该以一个或更多的假设来提出问题。假设只是一个命题,其真理是未知的。例如,假设可能是患有共证的患者。如果一个人是随机选择的,那么这个问题的答案将是未知的。但是,专家将对这一可能的可能性有一个初步的想法:我们将其称为先前的概率,这是事件发生的可能性的衡量标准,而没有任何更多信息。概率表示事件发生为0到1之间的数值的机会。可以从专家或从统计平均值中估算其值的良好估计值。在Covid的情况下,我们可以检查与人群数量相比的感染数量。我们编写p(h)以表示H的先验概率。

  下一步是使用将使用的证据来更新我们先前的H。我们通常将E - 写为P(e)的证据。贝叶斯意识到,通过结合假设的先验概率并使用当前观察结果的证据,他可以计算出反映当前情况的更新概率 - 称为后验概率。一旦我们具有假设的先验概率,我们就需要描述证据项目的知识将改变假设的可能性。我们将p(e/h)写为含义,如果假设h为真,则证据e是正确的概率。这就是说E的可能性是基于H的条件。从本质上讲,贝叶斯想象的是在收到新证据时更新假设的可能性的公式。如果新证据与假设一致,则假设的可能性增加,否则,它可能会降低。

  用数学符号编写的贝叶斯公式是

  要使用此公式,我们将获得右侧的值,将其插入公式,从中可以找到P(H/E)的更新值。换句话说,假设发生的机会的更新价值是我们观察到了证据E。所有数字处理都是由计算机完成的。但是,下面显示了一个示例,以说明如何使用贝叶斯推论来根据Covid测试的结果来更新Covid感染的预测。这?是简化的,不是基于真实数据。它的目的是展示如何在公式中使用数学来更新概率。

  例子

  假设在某个医院知道患者有1000个机会中有1000次的机会。假设还知道使用了99%准确的测试?测试阳性的患者的可能性是什么?

  要找到解决方案,我们需要找到右侧每个部分的值。即P(H),P(E/H)和P(E)。

  p(h)= 1/1000 = 0.001(因为有1%的机会无条件地获得共同的机会)

  p(e/h)= 0.99,这是给出的,因为99%的covid患者将测试阳性。

  现在p(e)= p(e/h)x p(h) + p(e/?h)x p(?h),其中?h表示没有covid。

  因此,p(?h)= 99/100 = 0.999。

  并且,p(e/?h)= 0.01

  因此,p(h/ e)= 0.99 x 0.001/(0.001 x 0.99 + 0.999 x 0.01)= 0.09。

  这意味着鉴于他或她,患者的机会有9%的机会?测试阳性。这可能会让某些人感到惊讶,但请记住,有1/1000的机会有共同的机会,因此在1000个样本中,我们希望有1个。在其余的999名没有它的人中,测试将大约一百次失败,这意味着我们希望其中大约有10个失败。我们有1个(共卷)和大约10个没有(covid)的约10,其优先级约为10分 - 非常接近贝叶斯公式的结果为0.09。

贝叶斯推论可用于根据COVID测试的结果来更新Covid感染的预测

  贝叶斯争议

  贝叶斯推论的使用也有时引起了争议,特别是?在法医科学中。例如,一名男子于1990年在英国被判强奸罪,并被判处16年徒刑,部分是基于DNA证据。检方的专家证人说,DNA可能与另一个人相同的机会仅为300万。

  但是该人对这句话提出上诉。一位专家声称,推理存在缺陷,因为这些证据将两个问题混合在一起:首先,鉴于它们是无辜的,一个人的DNA与样品中的DNA匹配的可能性有多大;其次,如果它们的DNA与样品的DNA相匹配,它们有多大可能是无辜的?尽管只有300万个与DNA相匹配的机会中只有1个,但总体人口被认为约为6000万。这意味着希望有20人有一个匹配的DNA,其中一个将是有罪的。因此,如果随机选择一个人,那么选择无辜者的20个机会中有19个机会?- 95%。这似乎很高,被称为“检察官的谬论”。但是,仅凭DNA证据就不足以确保定罪,因为其他证据会降低这种概率。例如,如果众所周知,在受害者被强奸的同时,20个中没有其他人可以在那个地区?然后将证据应用于贝叶斯将增加被告有罪的可能性。贝叶斯推断是一个概率更新过程,每一个新证据都可以证实有罪的可能性。

  使用贝叶斯推断的假设

  在非常大的系统中应用贝叶斯推论有时很难,因为导致假设的证据项目必须独立?彼此的。这意味着所使用的两项证据不会影响另一个。当几个证据与几个假设相互联系时,这可能是一个艰巨的任务。

  天真的贝叶斯学习系统

  问题之一?贝叶斯的推论是,对于大型系统,存在大量的假设和证据,可能导致相互联系的假设和证据的组合爆炸。通过将机器学习应用于数据,可以避免大量的手工编码。天真的贝叶斯学习系统是一个分类神经网络,假设证据的预测因素与使用贝叶斯定理一样独立。这种方法借鉴了从经验中学习的方法,再加上贝叶斯定理的应用?

垃圾邮件今天占所有邮件的39%。学分:etonic.net

  它使用监督的学习示例。即,将其输出输出到学习算法的数据示例,并与大型数据集使用更好的工作。通过将数据转换为统计频率表,可以学习到前面描述的每个类别的后验值。然后,它将预测值(假设)排名为最高值以进行预测。幼稚的贝叶斯效果很好 - 即使违反了独立标准。这就是为什么它被称为幼稚贝叶斯学习的原因。天真的贝叶斯学习模型正在幕后使用,在我们所有人每天在智能手机上使用的许多应用程序中。例如,Naive Bayesian学习被广泛地用于电子邮件系统上的垃圾邮件过滤,以及智能手机的能源管理系统以及许多其他用途。

  结论

  贝叶斯推论已成为一种成功的AI技术,既是计算系统,又是从学习模型中得出的一种。如果某些条件盛行,它也非常适合广泛的应用域。贝叶斯推论可能会在未来开发的许多AI系统中发挥作用。

  基思·达林顿