“逆向工程数据库架构:GPT vs. Bard vs. LLama2(第2集)”

“逆向工程数据库架构:GPT、Bard和LLama2对比(第二集)”

在我的上一篇文章中,我对比了GPT-4模型和巴德。现在Llama-2进入竞技场,是时候看看它在与竞争对手的比较中表现如何了!

来自Dustin Humes的照片,Unsplash上的照片

初始(和最终)数据集

第一篇文章中所解释的,我们将从一个包含员工信息的人工智能生成数据集开始。

反向工程数据库模式和质量检查:GPT vs. Bard

LLMs能否通过反向工程整合的数据集设计原始数据库并建议相应数据?

towardsdatascience.com

原始表格有11列×7688行,但我们将提取50行样本以适应当前LLMs的令牌限制。

源数据示例(作者提供的图片

(注意:笔记本和数据源可在文章末尾获取)

反向工程数据模型

这里的想法是让每个LLM分析这个样本数据并提供一些关于初始数据模式可能是什么的见解。

我们将使用与GPT-4和Bard相同的提示:

能否:- 确定数据集中的分类列和机密列- 提供一个具有不同表的数据库模式(注意为机密数据创建一个单独的表)- 对于具有分类数据的表,请提供创建它们的SQL脚本,包括它们的内容(Key和Value)- 对于其余的表,请提供创建它们的脚本- 对于每个表的每个列,请提供一些数据质量检查

好极了!…但现在的问题是“我在哪里可以测试Llama-2?”

有几种选择可供选择:

  • 最明显的选择(但也更复杂和昂贵💸)是在您的云架构上专门的服务器上托管模型。这通常是一个…