使用图数据库查询入门,附有速查表!
图数据库查询入门指南及速查表
图形数据库每年都在获得动力。它们永远不会完全取代关系型数据库,也不是在尝试这样做。但它们将开始进入datalakes和数据仓库正在努力的领域。图形数据库在分析事件、资源和人员网络时更快速和直观:
- 涉及复杂模式和偶尔欺诈的金融交易
- 患者、医务人员、设施和设备之间的医疗互动
- 客户、供应商、承包商和产品之间的供应链网络
- 制造业物料清单和输入材料配方
这些类型的网络关系在关系型或维度化数据模型中很难建模和可视化。图形数据库提供了一个模拟实际业务中网络的结构。
在开始使用图形数据库和查询语言时,准备好进行思维模式的转变非常重要。首先,尚未出现广泛接受的查询语言标准,如SQL语言。正如您在附件中所见,有一组竞争性语言和一个委员会正在努力使每个人都同意一个单一的GQL标准。在今天的目的上,我们将使用Cypher查询语言,它由顶级数据库供应商Neo4j开发和推广。
在图形查询中,我们失去了部分SQL的语法,同时还获得了其他的语法。SELECT被MATCH替换。FROM和JOIN被舍弃。但WHERE和ORDER BY命令的使用方式与SQL相同。SUM和AVG等聚合函数都存在,但GROUP BY被舍弃。最重要的是,我们获得了使用节点关系查询图形模式的能力。在附带的Cheat Sheet中,您将看到一系列常用的查询方法。
以下是将在附带的Cheat Sheet中使用的图形模型:
我选择了一个租赁图,因为几乎每个人在生活中都租过房!当然,如果我们添加了每个节点的完整属性列表,这个图将变得更加复杂。
下一步是进行一些实践。您可以从诸如Kaggle的来源或供应商(如JanusGraph或Neo4j)下载示例数据集。
如果您在雇主或业余项目中涉及网络关系,请尝试使用图形数据库。您将发现,在关系型数据库中安排不当的数据在图形数据库中是合适的住所!
****[Stan Pugsley](https://www.linkedin.com/in/spugsley/)**** 是一名位于犹他州盐湖城的自由数据工程和分析顾问。他还在犹他大学埃克尔斯商学院担任讲师。您可以通过电子邮件联系作者。