本文中使用的内容如下:
从前21日到26日,描述了数据的整体情况,但是有时我们需要了解数据中数据中的变量之间的关系。关系之间关系的索引称为关系的数量。它通常由R表示:
其中,COV(x,y)是x和y,var [x]的协作方差,是x的差异,var [y]是y的正方形差异
需要注意以下几点相关系数:
相关系数r的范围为[-1,1]
R的绝对值越大,相关性越强
r的正和阴性代表相关性,正相关,负代表的方向
笔记:
应该指出的是,相关系数具有明显的劣势,即,它的程度接近数据组n的数量,这很容易给人们一个幻觉。因为当n很小时,相关系数的波动较小时,大,样品数量的绝对值很容易接近1;当n较大时,相关系数的绝对值很容易较小。尤其是当n = 2时,相关系数的绝对值始终是1.因此,当样本容量n很小时,确定确定该样本容量n是不合适的。变量X和Y之间的紧密线性关系由大系数确定。
相关性不等于因果关系。相关性只能解释有两件事有关。因果关系是一件事导致另一件事。
相关操作主要由Corr函数使用
让我们看一下原始情况:
结果:
结果:
结果:
