这份AI通讯是你需要的一切 #75

这份AI通讯带给你所需的一切 #75 - 时尚美妆专家的视角

本周AI动向：Louie发表了什么

这周OpenAI的戏剧性事件告一段落，Sam Altman和Greg Brockman重返OpenAI，两位新董事加入董事会（以及一位现有董事）。在某种程度上，我们认为这比OpenAI初始状态更有利，Sam的控制力得到了更多检查和平衡（他现在不在董事会上），并且更迫切地寻求长期民主董事会治理解决方案。然而，这可能会造成持久性的损害，一些企业担心依赖这样一个拥有如此复杂和潜在不稳定的治理结构的组织。我们预计这将支持在现有趋势下构建产品，这些产品对单一LLM的依赖有限，LLM可以在短时间内被替换为替代API或开源模型。

离开OpenAI——我们很高兴看到Stability AI本周推出了一个新的视频生成模型，还有Anthropic的改进后的Claude 2.1模型以及Inflection.AI的Inflection-2模型（很快可以通过其数字助手界面Pi访问）。我们在文本/图像到视频模型能力方面仍处于早期阶段；然而，发布一个功能强大的开源视频生成基础模型可以帮助推动该领域的进展。我们也很高兴看到LLM领域的竞争加剧，企业们试图利用OpenAI的动荡。

你为什么要关注

我们认为OpenAI的治理结构对于其模型上建立的成千上万的企业和个人的短期稳定以及长期的经济和地缘政治稳定非常重要，尤其是在OpenAI变得越来越强大的情况下。在我们看来，OpenAI的治理问题仍然远未解决。短期来看，需要一个更大更多样化的董事会。长期来看，如果OpenAI确实能够继续实现其宏伟目标，可能需要一种形式的民主和去中心化管理，以控制世界上最强大的组织之一。鉴于此，我们必须继续看到其他公司和组织推出新模型，同时开源AI运动也在继续开发具有较少集中依赖的模型。

– Louie Peters — Towards AI联合创始人兼首席执行官

五个 5 分钟阅读/视频助你持续学习

阅读安德烈·卡帕斯基的《大型语言模型视频介绍》阅读列表

安德烈·卡帕斯基发布了一段长达一小时的视频，名为《大型语言模型（LLMs）简介》，为机器学习专家和新手提供宝贵的见解、资源和论文。这个简明指南涵盖了视频的主要内容，并参考了相关论文。

2. Distil-Whisper 解读 —— 最新的 AI 语音转文字技术！

Distil-Whisper 是一种具有最先进结果的语音识别模型，可用于转录任何类型的音频。在这个视频中，Louis Bouchard 探讨了该模型的功能、建立方式和工作原理。

3. AI 中的新兴工具和框架：一项比较分析

本文对 AI 中的新兴工具和框架进行了比较，比较它们的优势、可用性和理想用例。它比较了像 TensorFlow 和 PyTorch 这样的成熟基础，无代码 AI/ML 平台，基于云的 AI 服务，以及以视觉为重点的框架等。

4. 使用 Lookahead Decoding 打破 LLM 推理的顺序依赖

Lookahead Decoding 是一种新的、准确的并行解码算法，用于加速 LLM 推理过程。该文章介绍了这种新方法以及演示和实验结果。

5. 33 位 AI 初创公司创始人就人工综合智能的创建进行辩论

由 Y Combinator 制作的这段五分钟视频介绍了来自 33 位专注于 AI 的 YC 创始人的见解。根据他们对人工智能的现有理解，他们分享了有关 AGI 可能何时成为现实的时间线。

资源库和工具

GPT4All 是一个在消费级 CPU 和任何 GPU 上本地运行强大、定制的大型语言模型的生态系统。该文件大小为 3GB – 8GB，您可以下载并插入 GPT4All 开源生态系统软件中。
Llama Packs 是一个由社区驱动的预打包模块中心，可与 LlamaIndex 和 LangChain 一起使用。其目标是将大型语言模型与各种知识源轻松连接起来。他们已经发布了 16 多个模板。
Tuna 是一个无代码工具，可快速从零开始生成 LLM 微调数据集。它有助于为像 LLaMas 这样的大型语言模型创建高质量的训练数据。
Codesandbox 是由 Codeium 提供支持的代码自动补全工具。它提供单行和多行代码生成，提供多个建议供选择。