在学习机器学习之前,首先要掌握这些概率论的基础知识。一些以往容易被忽视的新线索。那么其中最重要的一个就是——概率。可能有的朋友看到??概率会问,我们已经有那么多好用的数学工具了,为什么还要概率呢?我们有微积分可以解决多个尺度并测量它们的变化;我们可以借用方程变化的线性代数,有很多很多的数学工具,几乎可以解决我们能想到的所有问题。概率好像没那么重要了?但事实上,我们生活在一个充满混乱和不确定性的世界,很多事情都无法准确衡量。当我们进行研究时,我们面临着随机误差和不确定性的干扰。不确定性几乎无处不在,我们需要了解它的行为,掌握并利用它,这就是我们需要概率论和统计学的原因。如今,概率已经渗透到人工智能、粒子物理学、社会科学、生物信息学的方方面面,甚至渗透到我们日常生活的点点滴滴。概率和统计的概念非常重要。下面我们将解释与概率相关的不同概率。希望大家对概率有更清晰的认识。频率理论概率想象一下,我们要衡量一枚硬币是否均匀。我们需要进行什么样的实验?我们需要不断抛硬币并记录每个方向。重复1000次后,让我们看看实验结果。如果结果是600次上涨和400次下跌,那么我们得到60%和40%的概率。这个概率可以作为硬币面朝上或面朝下的概率,这种方法就成为频率派的概率论。条件概率频率论者的观点需要通过大量实验的记录来总结。但条件概率是一个不同的观点,即在事件B发生的情况下事件A发生的概率。我们来看两个例子:如果我们看到闪电和雷声,下雨的概率是多少?晴天下雨的概率是多少?在上面的欧拉图中我们可以看到大的P(Rain|Thunder)=1。这意味着打雷会下雨(假设100%),但是P(Rain|Sunny)呢?虽然这个概率很小,但是我们怎么通过一个公式来表达呢?这导致了条件概率表达式:我们通过同时下雨和太阳的概率除以太阳的概率来计算给定太阳下雨的条件概率。独立事件和相关事件如果一个事件的发生概率完全不受其他事件的影响,则称该事件是独立的。比如我们在掷骰子的时候,第一笔掷出2,第二次掷出2的概率,这两次掷是独立的,那么同时得到2的概率可以写成:但是为什么上面公式正确么?我们先把第一次和第二次掷骰子事件分别写成A和B,把同时得到2的概率写成事件A和B的联合概率分布:等式两边同时除以P(B)和使用条件概率的定义,我们得到以下公式:我们发现P(A|B)=P(A)。这意味着A和B是相对独立的,B的出现对A没有影响。贝叶斯概率频率学派一般用统计的方法求出模型的参数,而贝叶斯理论认为模型的参数也满足一定的分布。在贝叶斯统计中,每个参数都有自己的统计分布,在一定的数据下给出该参数出现的可能性的分布:这个公式的基础就是上面提到的条件概率:虽然表达式很简单,但是贝叶斯理论是如此强大以至于它被广泛应用于各个学科,甚至催生了统计学的一个分支,称为贝叶斯统计。如果对贝叶概率感兴趣,下面的博客是很好的学习资料:https://www.countbayesie.com/blog/2015/2/18/bayes-theorem-with-legodistribution有朋友会问,贝叶斯概率很好,那什么是分布?分布实际上是一个(实验或数学推导)函数,描述了某一数量的不同取值范围和概率。函数中有一些参数可以调整。分布的行为(值的范围和概率)。当我们测量硬币的正面和反面时,我们得到一个分布,称为经验概率分布。在现实生活中,很多类似的事情都可以用概率分布来描述。例如,抛硬币实验满足伯努利分布,通过这个分布可以计算n次实验后哪一面朝上的概率。在概率论中,还有一个概念叫随机变量,需要弄清楚。每个随机变量都有自己的分布。我们通常习惯将随机变量写成大写字母,并用~表示其所属的分布:上式表示随机变量X满足0.6的伯努利分布。连续分布和离散分布概率分布一般分为两种情况:离散分布和连续分布。离散分布是指随机变量只在某些有限的位置取值,比如抛硬币的伯努利分布。离散分布通常由概率质量函数ProbabilityMassFunctions(PMF)定义;而连续分布一般用于处理无穷多个随机变量取值的情况。例如,用噪声测量速度是连续分布的一个例子。连续分布通常使用概率密度函数(PDF)来定义。相应的离散概率用连续相加的∑符号描述,连续概率用∫符号描述。样本和统计假设我们要进行人体身高测量研究。我们在街上随机测量一些陌生人的身高,那么这个测量就可以看作是独立的。我们把从总体中随机选择样本的过程称为抽样。统计学的作用是从这些数据中总结和提取信息,比如计算这些样本的均值:样本的标准差计算如下:这个公式用来描述数据点与其均值的偏差。更进阶的学习学那么多不是很好吗?你一定想更深入地学习!这些知识一定会让你在以后的研究工作中受益匪浅,加深理解。入门级:可汗学院很好,深入浅出地讲解了很多相关的基础知识。https://www.khanacademy.org/math/statistics-probabilityAdvancedlevel:AlloftheStatistics是一个简洁的教程,里面包含了统计学的重要知识点,但是需要注意的是你需要线性代数和微积分的基础知识才能顺利完成学业。https://www.amazon.com/All-Statistics-Statistical-Inference-Springer/dp/0387402721希望大家在概率中发现更多的美,在自己的学习和工作中熟练运用相关思想,取得更好的成绩。
