这是P-Hacking的解决方案吗?
这是P-Hacking的解决方案吗?' - 一种解决P-Hacking的方法?
E值,p值的更好替代方案
在科学研究中,数据操纵和窥探结果一直是存在的问题。研究人员通常希望获得显著的p值以便发表论文,这会导致早期终止数据收集或操纵数据的诱惑。这种实践被称为p-hacking,是我之前的一篇文章的重点。链接请见。如果研究人员决定故意改变数据值或伪造完整的数据集,那我们无可奈何。然而,对于某些p-hacking的情况,可能有解决方案!
在本文中,我们着眼于安全测试的话题。相较于传统的假设检验方法,安全测试具有一些强大的优势。例如,该测试方法允许将多个研究的结果进行综合。另外一个优点是你可以根据需要随时停止实验。为了说明安全测试,我们将使用研究人员提出的R包“安全统计学”。e值已经被像Netflix和Amazon这样的公司使用,因为它们的优势。
本文不会深入研究该理论的证明,而是从实际角度出发,展示如何在自己的测试中使用e值。所述的原始论文是一个很好的资源,其中提供了证明和详细解释的内容。原始论文请见此处。
E值简介
在假设检验中,你可以在这里了解详情,你评估是保留零假设还是接受备择假设。通常,使用p值进行评估。如果p值小于预定的显著性水平α,则接受备择假设。
- 通过MM-VID解锁先进的AI视频理解,为GPT-4V(视觉)提供支持
- 研究一个人道主义灾难情景报告聊天机器人——使用GPT-4-Turbo和全上下文引导
- Oracle首次推出带有增强的读写分离功能的MySQL 8.2
E值的功能与p值不同,但二者有关。对e值最简单的解释是这样的:假设你在与零假设进行赌博。你投资1美元,而回报价值等于E美元。如果e值E在0和1之间,你输了,零假设成立。另一方面,如果e值大于1,你赢了!零假设失败了。 e值只是1.1表示有限的反对证据…