什么是PDF、PMF和CDF?.PDF、PMF、CDF的概念确实很容易混淆。今天我们就来了解一下这些概念。1、基本概念PDF:是英文单词probabilitydensityfunction的缩写,翻译过来指的是概率密度函数,用来描述一个连续随机变量的输出值,某值点附近某个值的概率一定的价值函数。PMF:是英文单词probabilitymassfunction的缩写。翻译过来就是指概率质量函数,它用来描述离散随机变量在每个特定值处的概率。CDF:是英文单词cumulativedistributionfunction的缩写。翻译指的是累积分布函数,又称分布函数,是概率密度函数的积分,用来表示离散随机变量x的概率分布。综上所述,以上三者的横轴为随机变量x的取值,PDF的纵轴表示连续随机变量x出现的可能性(非概率),纵轴为PMF表示离散随机变量x出现的概率,CDF的纵轴表示连续随机变量x出现的概率。相信看完上面的概念,你对这些概念还是有些迷茫的。接下来,我们来详细谈谈这些概念的来龙去脉。2.频率分布条形图频率分布条形图主要用于离散数据。横轴是每个具体的点(类别),纵轴是这些点对应的频率。当试验次数足够大时,我们可以用频数代替概率,即频数分布条形图中的纵轴可以看作是每个类别的概率值。此时的频数分布柱状图可以看作是PMF图。3.频数分布直方图在频数分布直方图中,横轴表示许多连续变量离散化后的区间。这个区间的大小称为群距,纵轴代表频率/群距。上图中每个矩形的面积就是区间出现的频率,也就是概率。当矩形的宽度无限小时,即组距离无限小时,频率分布直方图无限接近下面的平滑曲线。我们称这条曲线为概率密度曲线,或PDF。4.累积分布函数累积分布函数从上图中概率密度曲线最左边开始,逐渐向右求曲线下面积,即概率。以上就是关于PDF、PMF、CDF的异同点。如果对公式推导感兴趣,可以直接上网搜索。
