当前位置: 首页 > 后端技术 > Python

统计科学讲座中的自由度

时间:2023-03-25 20:15:08 Python

是多少?我们在前面的方差分析中提到了一个概念,就是自由度。在上一篇文章中,我们给出了一个计算,即自由度=样本数-1。在这篇文章中,我们将详细讨论什么是自由度。先来看看百度百科的解释:自由度(df)是指在计算某个统计量时,其取值不受限制的变量个数。通常df=n-k。其中,n为样本数,k为限制条件或变量数。上面加粗的部分其实就是关于自由度的核心解释。再举个例子:假设有三个变量x1、x2、x3,这三个变量之间没有联系,那么这三个变量的取值是独立的、不受限制的、互不干扰的的。此时自由度为3,因为有3个变量的值不受限制。如果我们对上面三个变量加上一个限制条件,即x1+x2+x3=0,这时候这三个变量的值就不能是任意的了。前两个变量的取值可以任意,但是第三个第一个变量的取值受前两个变量取值的限制,所以此时取值不受限的变量个数变为2,对应的自由度就变成了2。了解了自由度的核心原理之后,我们来看看自由度的主要应用场景:1.Variance第一个场景是总体方差和样本方差。我们知道总体方差的分母是n,样本方差的分母是n-1,这是因为计算样本方差需要样本均值。如果样本均值已知,则构成样本的n个样本之一的值将受到限制。此时的自由度变为n-1。再想想方差的概念。方差其实看的是n个样本的平均波动程度,也就是这n个样本加在一起造成的波动有多大。在样本方差中,只有n-1个样本可以真正判断波动,所以划分n-1个。2、回归还涉及到回归方程中的自由度。假设现在有nx个变量,因为这nx构成了一个方程,这个方程是一个约束条件。此时有n-1个变量可以自由变换,对应的自由度为n-1。以上就是关于自由度的简单介绍,大家应该都很好理解。