统计科学讲座中的异方差性是什么?相同方差=相同+方差,顾名思义,方差相同。方差是多少?方差用于反映数据的波动情况,方差相同表示数据的波动情况相同。说完同方差大家应该明白什么是异方差了。异方差意味着方差不相同。为什么要讨论异方差?因为我们假设样本在回归分析和方差分析中都是同方差的。在方差分析中,同方差意味着组间方差相等;在回归分析中,同方差性是指对于每个样本点,随机误差的平方和(残差平方和)相同。我们在回归部分告诉过你,残差平方和就是回归值和实际值之间距离的平方和。这部分是由自变量X以外的其他影响因素引起的,所以我们称这部分误差为随机误差,如果随机误差对不同样本点的影响相同,则随机误差的平方和为相同,即方差相同,否则为异方差。下图反映了相同的方差,即不同教育年限组间的工资波动是相同的。下图体现了异方差性,即不同受教育年限的群体工资波动不同。受教育年限越长,工资波动越大;受教育年限越短,工资波动越小。了解了什么是异方差之后,我们来看看如何看不同的样本点是同方差还是异方差?这就涉及到异方差性的检验。检验异方差性有描述性统计方法和专门的统计检验方法。这里主要和大家分享的是描述性统计方法——见残差图。残差图以残差平方和为纵坐标,一般以回归拟合值y为横坐标。当然也可以用其他自变量x作为横坐标。下面是几种不同类型的残差图:上面的残差图类型:随着横轴的变化,纵轴围绕一条水平线上下波动,说明数据是同方差的。上述类型的残差图:随着横轴的增大,纵轴的值变小,说明不同样本之间的点间方差不同,即异方差性。上面一类残差图:横轴和残差之间存在二次关系,也是异方差的。关于上面的残差图是怎么画的,我们会在后面的回归实战部分给大家讲解。
