R语言corrplot包中的corrplot()函数,提供了一整套对相关系数可视化的包,可很容易就将文字结果转化为图片,使您的报告更加光彩夺目,颜值瞬间上升几个档次。ggplot2是R语言可视化大杀器,自带的mtcars数据集收录了32辆汽车在11个指标上的数据。下面就以mtcars为例,讲解相关系数的可视化。
01
相关系数的计算
#在计算之前,首先安装两个安装包
install.packages("ggplot2")
install.packages("corrplot")
#加载安装包
library(ggplot2)
library(corrpolt)
#查看数据集
mtcars
图2 mtcars数据集基本情况
变量数较多,为了方便讲解,接下来我们只使用前5个变量进行相关性分析。
#计算前5个变量的相关系数
corr <- cor(mtcars[,1:5])
#查看相关系数
corr
图3 计算得到的相关系数矩阵
02
相关系数的可视化
#参数全部默认情况下的相关系数图
corrplot(corr = corr)
图4 默认情况下可视化结果
从结果可以看出,默认情况下的输出简单粗暴,只能通过颜色和大小看出大概的情况,并不能看出相关系数的具体数值。下面通过参数改变参数进行调节。
#指定数值方法的相关系数图
图5 文字结果可视化
结果为文字转化为图片而已,和SPSS输出没有多少差别,如果将两者结合起来,可能效果会更好。
#两者结合起来,看看效果
图6 两组结合可视化
相对好了很多,但是,这种方式下,有可能图片颜色覆盖了数值,是具体值难以辨认,我们发现,以对角线为届,两边的数值是对称的。如果将一般设置为数值,一般设置为图片,可能效果会好一些。
#首先画出右上部分图形
corrplot(corr = corr,order="AOE",type="upper",tl.pos="tp")
#再添加左下部分的数值
corrplot(corr = corr,add=TRUE, type="lower", method="number",order="AOE", col="black",diag=FALSE,tl.pos="n", cl.pos="n")
图7 调整结果
转载自:http://www.pinlue.com/article/2017/07/0518/443213523721.html
相关链接:
http://blog.sina.com.cn/s/blog_73b6c16e0102uw6n.html
https://rpubs.com/loness/183681
https://cosx.org/2009/03/correlation-matrix-visualization/