认识DeepOnto:一个使用深度学习进行本体工程的Python包
深度学习本体工程Python包:DeepOnto
深度学习方法的进步对人工智能社区产生了巨大影响。随着一些伟大的创新和发展,许多任务变得更加容易。深度学习技术被广泛应用于几乎每个行业,包括医疗保健、社交媒体、工程、金融和教育等。其中最好的深度学习发明之一是大型语言模型(LLMs),它最近因其令人难以置信的用例而广受关注。这些模型模仿人类,并通过利用自然语言处理或计算机视觉的能力,展示出一些令人惊叹的解决方案。
大型语言模型在本体工程领域的应用一直是讨论的话题。本体工程是知识工程的一个分支,涉及本体的创建、构建、策划、评估和维护。本体基本上是在特定领域内的知识的正式和精确规范,它提供了一个系统性的概念和属性词汇,以及它们之间的关系,以实现人类和机器之间的语义共享理解。
众所周知,像OWL API和Jena这样的本体API主要是基于Java的,而像PyTorch和Tensorflow这样的深度学习框架通常是用于Python编程。这给解决问题带来了挑战,为此,一支研究团队推出了DeepOnto,这是一个专门为本体工程开发的Python包,能够无缝地集成这些框架和API。
DeepOnto包为基于深度学习的本体工程提供了全面、通用和友好的Python支持,它包含一个本体处理模块作为基础,支持加载、保存、查询实体、修改实体和公理等基本操作,以及推理和语言化等高级功能。它还包括本体对齐、完成和基于本体的语言模型探索的工具和资源。
团队选择了OWL API作为DeepOnto的后端依赖项。这是因为API具有稳定性、可靠性,并在ROBOT和HermiT等重要项目和工具中得到广泛应用。由于PyTorch具有动态计算图的特性,可以在运行时调整模型的架构,提供了灵活性和易用性,因此它成为DeepOnto的深度学习依赖的基础。Huggingface的Transformers库被用于语言模型应用,OpenPrompt库被用于支持提示学习范式,这是ChatGPT等大型语言模型的重要基础。
DeepOnto的基本本体处理模块由多个部分组成,每个部分执行特定的任务 – 首先是本体,DeepOnto的基类,提供了查看和更改本体的基本方法。其次,是本体推理,用于进行推理活动,接着是本体修剪,从本体中提取可扩展的子集,具体取决于特定的标准,如语义类型。最后,本体语言化可以提高本体的可访问性,并通过将本体元素转化为自然语言文本来帮助各种本体工程活动。
团队通过两个用例展示了DeepOnto的实际实用性。第一个用例是在三星研究英国的数字健康辅导框架中,使用DeepOnto来帮助本体工程任务。第二个用例是Ontology Alignment Evaluation Initiative(OAEI)的Bio-ML轨道,使用DeepOnto来使用深度学习技术对生物医学本体进行对齐和完成。
总之,DeepOnto是本体工程领域的一个强大包,是人工智能领域发展的重要补充。对于未来的实施和项目,如逻辑嵌入和新概念的发现和引入,DeepOnto提供了一个灵活和可扩展的接口。