如何使用Chat-GPT和Python根据自己的文章在Neo4j中构建知识图谱
使用Chat-GPT和Python构建知识图谱
一张包含超过120篇关于数学和数据科学的文章的结构化知识图

在本文中,我将展示如何使用图技术和一些编程来构建和探索自己文章的内容。
利用自然语言处理技术对非结构化数据进行结构化的想法并不新鲜,然而,大型语言模型(LLMs)的最新进展为这一领域带来了无数的机会。通过蓬勃发展的Chat-GPT技术,即使是业余爱好者也能够轻松接触LLMs和生成模型。
实际上,生成式人工智能已经成为许多公司的议题!
本文将使用Python编程语言,并使用OpenAI的开发者API来处理VoAGI(元数据?)的数据并构建知识图。听起来可能有点复杂,但实际上非常容易上手。
开始
首先要做的是制定攻略。
- 使API正常工作并通过Python进行访问。
- 使用样本文本进行提示工程,确保GPT-4模型能够理解您的意图。
- 从VoAGI下载文章(当然您也可以使用其他文本片段),并对数据进行预处理。
- 提取和收集Chat-GPT的输出。
- 对Chat-GPT的输出进行后处理
- 使用Cypher查询语言编写代码,将数据进一步结构化成图形。
- 与您的新朋友一起探索和研究您的文章。
言归正传,让我们通过快速设置基本技术来开始吧。
设置
我们需要在本地计算机上安装Python编程语言和图形数据库Neo4j。
首先,确保您在OpenAI上拥有一个plus账户,以便您可以使用GPT-4。…