如何在10分钟内使用Unbody和Appsmith建立一个Google Meet AI助手应用
在10分钟内使用Unbody和Appsmith打造Google Meet AI助手应用的方法
高效的沟通和有效的会议管理是现代职场团队成功的关键。出于这个认知,我们将开发一款基于人工智能的会议助手应用程序,将Google Meet会议录音转化为自动生成的会议笔记,其中包含关键摘要和行动事项。本博客适合所有的创作者,从开发人员到非编码人员,对人工智能和生产力工具的交集都感兴趣。对于那些在人工智能开发经验有限,希望使用简单的低代码工具(如Unbody和Appsmith)构建人工智能应用程序的人特别有用。
介绍人工智能驱动的会议助手应用
想象一下,这款应用程序连接到您的Google Drive,其中保存着您的Google Meet视频录音,并自动捕获会议音频转录,并即时生成带有关键要点和行动事项的会议笔记。您可以完全专注于会议中的对话,而无需独自记笔记。如果您迟到或无法参加会议,应用仍然会记录笔记。此应用可以提高虚拟会议的生产率,包括团队领导、项目经理、开发人员以及经常使用Google Meet的任何人都可以从中受益。
当然,市场上已经存在许多现有的解决方案,比如Otter.ai或Fathom。但如果您想自己构建一个工具,并自定义其输出,那么您与我站在同一起跑线上。为了开发这个应用,我们将使用Unbody将输入的视频转录转化为智能/生成内容,并使用Appsmith来轻松设计和构建应用的用户界面,而无需进行繁琐的前端编码。让我们了解一下应用中每个组件的作用。
Unbody是大脑
Unbody是我们的工具的核心,它能够实现知识插入、将音频转化为转录,并通过GraphQL API创建AI助手摘要和知识传递。通过Unbody先进的AI转换和内容分析功能,我们的项目能够从任何类型的会议音频中识别并提取行动事项。它将它们转化为结构化内容,确保不会遗漏重要信息。
Unbody还可以聚合和同步各种类型的文件,包括文本文档、PDF、电子表格、图像和视频。例如,Google Drive中的PDF文件、在Slack频道中共享的图像或本地文件夹中的视频文件都可以持续同步到Unbody。您可以在Amir Houieh的文章中了解更多关于Unbody的信息。
Appsmith是我们的前端
Appsmith是一个开源的低代码平台,旨在帮助开发人员快速高效地构建内部工具。它是我们应用的前端,为查看会议摘要和行动事项提供了可以定制和交互式的仪表板。Appsmith作为数据源连接到Unbody所暴露的GraphQL,并获取和显示小部件中的数据。
请点击这个一键演示链接,查看在Appsmith云端运行的应用。
工作原理
您只需要做以下几步:
- 开启视频录制,使其在Google Meet会话期间进行录制,录音将自动上传到您的Google Drive的“我的云端硬盘 > 会议录音”文件夹。
- 将Google Drive作为Unbody的内容来源连接。Unbody会在检测到任何更改时从您的云端硬盘获取最新的更改。Unbody的人工智能引擎会处理内容并进行索引。例如,我们使用Unbody从视频转录中提取关键要点和决策。
- 使用GraphQL检索Unbody的内容API的结果。您可以编写自定义的GraphQL查询来获取会议摘要和特定行动事项。GraphQL端点充当您在Google Drive中的视频录音和Appsmith仪表板之间的数据接口。
- 访问Appsmith仪表板,查看会议摘要和行动事项。该仪表板提供了所有正在进行的任务和截止日期的实时概览。下面的图片展示了带有示例数据的仪表板:
在Appsmith仪表板上生成的AI助手报告会议
请看以下GIF了解整个过程:
如何设置和运行项目
已经实现了带有示例GraphQL查询的Appsmith UI的项目源代码,您可以查看GitHub存储库。要设置Unbody内容API,连接到您自己的Google Drive并运行UI,您需要按照此指南操作。
先决条件
- 您正在使用Google Meet并满足记录视频会议的要求。
- 您拥有一个Unbody账户。如果您没有,请免费创建一个新账户。
- 您拥有一个Appsmith账户。
- 您分叉了GitHub repo(在上一个段落中链接)。
第1步:在Google Meet中激活视频录制
进入会议后,开始在您的Google Meet会话中记录视频和转录。
录制停止或会议结束后,它将自动保存到带有“Meet Recordings”标签的Google Drive文件夹中。
视频录制会自动保存到Google Drive
第2步:设置Unbody项目
1. 访问您的Unbody仪表板,并从创建一个新项目开始。首先,您可能希望配置AI引擎和功能。
Unbody功能设置
Unbody使用一种称为大型语言模型(LLMs)的先进AI技术来解释文本输入。这些模型有各种类型和配置,Unbody提供了广泛的选择。我们将使用两个功能:文本向量化器和生成式搜索。
文本向量化器将您的Google Meet视频的转录转换为AI可理解的格式。对于将转录向量化的模型选择,我建议使用开源且免费的Contextionary选项。
关于文本向量化器的一些技术见解:
它是一种算法,用于创建转录的向量表示。向量表示只是浮点数,如5.5、0.25和-1.2。两个向量之间的距离衡量它们的相关性。较小的距离表示高相关性,较大的距离表示低相关性。Unbody还对向量表示进行了索引,以便于搜索。将其视为将图书组织在图书馆中以便于查找。
在Unbody对数据进行了索引之后,Unbody提供了各种生成式搜索引擎,目前仅来自OpenAI(ChatGPT)的引擎,以在文本材料上进行生成性操作。GPT在理解和使用语言方面非常出色,类似于人类。该引擎可以帮助我们总结会议中讨论的内容,并确定需要完成的任何任务或“行动项”。就像有一个助手在听您的会议然后告诉您要点和下一步要做什么一样。Unbody还将在将来支持其他生成式引擎,为您提供更多选择。
2. 连接到Google Drive和Google Calendar(如果您还需要在应用中包含事件详情时,可以选择性地连接)。
Unbody创建一个带有数据源的新项目
成功连接到数据源后,您应该在源列表中看到Google Drive和Google Calendar:
Google Drive和Calendar是Unbody选择的数据源
第4步:编写GraphQL查询
Unbody具有用户友好的GraphQL playground,您可以打开GraphQL选项卡,并尝试在repo中提取行动项或获取Google Calendar的事件预订详情的现有查询,或者编写您的新查询。
在Unbody GraphQL playground上编写自定义查询
第五步:使用Appsmith设置前端
接下来,您将从GitHub存储库中提取现有的Appsmith应用程序。您将其导入到Appsmith帐户中的新工作区中。按照Appsmith网站上的从存储库导入的步骤进行操作。
您也可以在本地计算机上安装使用Docker的Appsmith,除了使用云版本。
导入完成后,您将看到类似下面的画布:
Appsmith画布示例,用于构建UI应用程序
您可以使用拖放界面自定义仪表板。根据需要修改或添加表格、文本框和按钮等小部件。请注意,Appsmith不会导出用于连接数据源(如Unbody API_KEY
和PROJECT_ID
)的任何秘密配置或标头值。您需要找到在Unbody仪表板中生成的个人API密钥和项目ID,并手动在数据源标头中进行配置,类似于以下内容:
将Unbody连接为Appsmith的数据源
如您所见,该项目在Appsmith中设置了一个数据源,用于连接到您的Unbody GraphQL服务器。使用它来获取会议摘要并在仪表板中显示。导入后,其他API查询、UI页面和小部件将自动创建。
为Appsmith注册Unbody GraphQL查询
您可以通过点击屏幕右上角的预览按钮来运行应用程序,最终您将看到具有所有数据的仪表板。
结论
现在,您拥有了一个完全功能的应用程序,可以将Google Meet视频录制转化为可行动的总结和任务。基于AI的会议报告应用程序是将任何内容转化为易懂且可查询的知识库的良好示例。您采用了RAG(检索增强生成)方法,通过单个GraphQL端点提供了一个直观且强大的内容交互平台。此外,使用Appsmith的低代码拖放界面,显著减少了通常需要完成此类全栈任务的时间和工作量。对于更高级的功能,Unbody和Appsmith都允许使用JavaScript和TypeScript,为开发人员提供了编写自定义逻辑的灵活性。
下一步
此设置指南提供了一个基本框架,您可以根据自己的特定需求进行扩展和自定义。在应用程序中,您会注意到还有另一个未完成的页面,名为*Ask Meeting Notes.*利用本文中学到的知识,使用生成问答功能实现一个新的GraphQL查询,将数据带到输出文本小部件中。用户可以在搜索栏中搜索会议中的特定信息。