01。在前言中,我们讨论了简单的单向方差分析。在本文中,我们将讨论双因素方差分析和多因素方差分析。因素方差分析。单变量分析是指只有一个因素会影响要比较的均值,而多变量分析是指多个因素都会影响均值。需要注意的是,一个因素可能有不同的水平值,即不同的值。例如判断某种药物对某种疾病是否有效,服用不同剂量的效果应该是不同的。虽然该因素是服用药物的一个因素,但不同的药物剂量代表不同的水平。双因素(多因素)ANOVA可以分为两种,一种有交互作用,一种没有交互作用。你是什??么意思?什么是互动?例如,众所周知,牛奶和药物不能一起服用。单独喝牛奶可以帮助身体补充蛋白质,单独吃药可以帮助治疗疾病,但是牛奶和药物同时服用会使两者的效果相抵消。两者之间的这种互动,可以理解为互动。当然,互动有时是积极的,有时是消极的。02.非交互方差分析现在有如下不同品牌不同地区的产品销售数据表。我想看看不同品牌和不同地区这两个因素对销量有没有显着的影响:我们先看看没有交互。如何做效果的双因素方差分析?所谓无交互,就是假设品牌和区域之间没有交互,互不影响,只是独立影响销量。在前面的单因素方差分析中,我们使用了F值来检验显着性,多因素方差分析也使用了F值。F=组间方差/组内方差。对于没有交互作用的多因素,可以简单理解为多个单因素。也就是可以单看品牌对销量的影响,再单看地区对销量的影响。一个人怎么办?这可以追溯到我们之前谈到的单向方差分析。我们先计算品牌内的平方和:SSA=(每个品牌的平均值-所有销售额的平均值)^2*每个品牌内的样本数=(344.20-328.45)^2*5+(347.80-328.45)^2*5+(337.00-328.45)^2*5+(284.80-328.45)^2*5=13004.55让我们计算区域内的平方和:SSB=(每个区域的平均值-所有销售额的平均值)^2*每个区域的样本数量=(339.00-328.45)^2*4+(330.25-328.45)^2*4+(339.25-328.45)^2*4+(318.25-328.45)^2*4=2011.7然后我们来算一下所有的平方和:SST=(每个值-总体均值)^2=17888.95另外还有一个平方和:SSE=SST-SSA-SSB这部分是由品牌和地区以外的因素决定的称为随机误差平方和。有了平方和之后,我们还需要求均方,均方=平方和/自由度。SST自由度=总级别数-1=19SSA自由度=品牌级别-1=3SSB自由度=区域级别-1=4SSE自由度=SSA自由度*DegreeofFreedomofSSB=用12个平方和加上自由度,可以算出均方MS,然后进入最重要的F值计算,品牌因子的F值=SSA/SSE的F值区域因子的=SSB/最后,SSE通过查找F值表得到置信度为95%时的F边界值表,再与实际F值进行比较,最后做出显着性判断。如下表:03.交互方差分析某交通部门想知道高峰期和路段是否会影响汽车的行驶时间。以下数据是通过人工采集得到的:本次分析需要考虑高峰期和路段。交互作用,部分路段高峰出行时间可能异常高或异常低等。与无交互的多因素ANOVA过程类似,我们先计算高峰期的平方和:SSA=(各高峰期均值-总体均值)^2*各高峰期样本数=(23.2-20.25)^2*10+(17.3-20.25)^2*10=174.05然后计算截面的平方和:SSB=(各截面平均值-总体平均值)^2*各截面样本数=(22.4-20.25)^2*10+(18.1-20.25)^2*10=92.45然后计算交互作用的平方和:SSAB=(各路段平均值&高峰期-该路段平均值segment-本高峰期平均值+总体平均值)^2*每个区间样本数=(25.4-23.2-22.4+20.25)^2*5+(21-23.2-18.1+20.25)^2*5+(19.4-17.3-22.4+20.25)^2*5+(15.2-17.3-18.1+20.25)^2*5=0.05然后计算所有的平方和:SST=(每个值-总体均值)^2=329.75最后,计算误差的平方和:SSE=SST-SSA-SSB-SSABSST自由度om=总样本数-1=19SSA自由度=峰值数-1=1SSB自由度=路段-1=1SSAB自由度=SSA自由度*SSB自由度=1SSE自由度=SST的自由度-SSA的自由度-SSB的自由度-SSAB的自由度计算均方后查F表,可得下表:04.方差分析与回归分析异同点以上以有无交互作用的双因子ANOVA为例,说明了多因子ANOVA涉及的计算过程。在实际工作中,我们不需要自己手动计算。Excel和Python都可以计算。稍后将解释如何实现该工具。通过以上多因素方差分析,我们可以得到不同因素对某个目标值(销售额/出行时间等)的影响。你可能会有这样的疑问,那么这个和多元回归有什么区别呢?多元回归不也是求多个x和一个y的关系吗?这两个是一样的吗?还是有一些区别的。方差分析只是告诉你某个因素的影响显着与否,并没有告诉你影响有多大。回归分析告诉你具体影响有多大。方差分析是定性分析,解决是否存在的问题;回归分析是解决多少问题的定量分析。
