用Python构建带有P值的相关矩阵

Python构建带P值的相关矩阵

在Python中生成超越默认设置的相关性输出

概述

如果你是相关矩阵的粉丝,就像我一样,那么这篇文章就是为你而写的。这篇文章特别适用于使用Python生成、显示和分析相关矩阵的人。此外,对于像我这样从其他统计分析工具转来的人来说,这篇文章也是为了满足我们对比Python更全面和信息丰富的输出的期望。

以下是我想象中的,当我对Python中的默认工具不如我之前在职业生涯早期学到的其他统计分析工具对我好时,我会显得愤怒和沮丧的样子!

Photo by Julien L on Unsplash

例如,我之前写过关于Stata用户在合并数据文件时所习惯的缺失输出。如果你正在阅读这篇文章,并且不确定什么是相关矩阵,让我告诉你。

实践中的相关矩阵

相关矩阵是一张显示变量之间相关系数的表格。表格中的每个单元格显示两个变量之间的相关性,而对角线表示一个变量与自身的相关性,始终为1。矩阵中的值范围在-1到1之间。相关系数为1表示完全正相关,相关系数为-1表示完全负相关,相关系数为0表示两个变量之间没有关系。相关矩阵在统计分析中被广泛用于评估变量之间的线性关系,并确定彼此之间关系最强的变量。

这是一个常见的相关矩阵的样子。

Image Credit: Author’s table from Author’s publication.

解读相关矩阵

为了讨论,我在上表中用红框突出了第四行。在这个红框中,结果显示了年龄与三个结果指标之间的关系,包括…