一个对数据科学家友好的半变异函数教程,用于量化空间连续性

一个友好的半变异函数教程,用于量化空间连续性

应用于使用开源GSLib和Python的合成采矿数据集

Photo by Sebastian Pichler on Unsplash

介绍

变异图用于展示空间数据的基于距离的变异性。理解和建模变异图中的空间连续性非常重要,因为它们用于在广泛的应用中将点测量估计为实际块,例如采矿矿石品位、油浓度或环境污染物。

尽管存在可以生成变异图的开源选项,但由于其复杂性,大多数用户仍依赖昂贵的软件包,这些软件包将许多细节抽象化。本教程旨在简要介绍变异图以及如何使用开源地质统计库(GSLib)独立或与Python一起开发变异图。

这里,我们在合成采矿数据集上开发了一个变异图模型,但该工作流程可用于任何类型的空间数据,例如气象应用(如温度)或环境应用(如污染物跟踪)。

教程要求

我们需要GSLib,可以在此处免费下载,以及一些最基本、最常用的Python库,这些库也包含在上传到github的完整代码中:

import pandas as pdimport numpy as npimport matplotlib.pyplot as plt

变异图基础知识

变异图的一般思想是,相距较远的数据点比彼此相邻的数据点更可能不同。数据点之间的方差随着它们之间距离的增加最终达到与数据的全局方差相等的点。

我们从一个空间数据集开始,可以将变异图建模工作流程概括为以下几个步骤。首先,我们需要确定变异图的适当搜索参数。然后确定主要和次要连续轴。最后,可以对变异图进行建模,并随后用于估计或模拟目的。下面将进一步解释每个步骤…