理解独立性以及在因果推断和因果验证中的重要性
深入理解独立性,探讨在因果推断和因果验证中的重要作用
逐步指南:理解独立性概念并如何应用它来验证使用Python进行因果验证的有向无环图
背景
在最近一篇文章中,作者探讨和解释了如何使用依赖性概念来验证提议的有向无环图(DAG)与数据集相对应,以识别图中的虚假边缘,即DAG中提议的可能不存在于数据中的因果关联。
在本系列的第二篇文章中,将应用相反但同样重要的概念,即如何使用独立性来识别缺失的边缘。这些是在提议的DAG中没有出现的因果关联,但实际上存在于数据中,必须添加回DAG中以使其完整和正确。
介绍
因果推断是数据科学的新兴分支,涉及确定事件和结果之间的因果关系,它有潜力为组织带来可观的价值。
例如,传统的机器学习算法可以预测哪些贷款客户可能违约,从而使得可以与客户进行积极干预。然而,虽然这个算法对于减少贷款违约是有用的,但它对于违约原因没有概念,而知道违约原因将使得可以解决潜在原因。在这种情况下,积极干预可能不再必要,因为导致违约的因素已经永久解决。
这就是因果推断的承诺,以及为什么它有潜力为那些能够利用这个潜力的组织带来重要影响和结果。
有许多不同的方法,但最常见的方法通常是通过”有向无环图”(DAG)来增强数据,将数据中的因果关系进行封装和可视化,然后使用因果推断技术来提出问题…