Pearson相关系数R代码实现
Pearson相关系数(Pearson Correlation Coefficient)
Pearson’s r,称为皮尔逊相关系数(Pearson correlation coefficient),用来反映两个随机变量之间的线性相关程度。 要理解皮尔逊相关系数,首先要理解协方差(Covariance)。协方差可以反映两个随机变量之间的关系,如果一个变量跟随着另一个变量一起变大或者变小,那么这两个变量的协方差就是正值,就表示这两个变量之间呈正相关关系,反之相反。 如果协方差的值是个很大的正数,我们可以得到两个可能的结论: (1) 两个变量之间呈很强的正相关性 (2) 两个变量之间并没有很强的正相关性,协方差的值很大是因为X或Y的标准差很大 那么到底哪个结论正确呢?只要把X和Y变量的标准差,从协方差中剔除不就知道了吗?协方差能告诉我们两个随机变量之间的关系,但是却没法衡量变量之间相关性的强弱。因此,为了更好地度量两个随机变量之间的相关程度,引入了皮尔逊相关系数。可以看到,皮尔逊相关系数就是用协方差除以两个变量的标准差得到的。 代码如下:
> setwd("F:\\blog"