这份AI快讯就是你所需要的 #65

This AI news is what you need #65.

Louie的AI本周发生了什么

本周在AI领域,国会出台了一些AI监管的发展:埃隆·马斯克(Elon Musk)和马克·扎克伯格(Mark Zuckerberg)等科技领袖与60多名参议员进行了关于AI的讨论。猜猜看?他们都同意——现在是时候制定一些基本规则了。埃隆·马斯克甚至表示这次会议“可能会被载入史册,对于人类文明的未来非常重要。”政府的进展可能不会很快,但关于需要萨姆大叔介入监管的讨论正在升温。

在本周的一项令人兴奋的发展中,OpenAI和Google据说在发布下一代LLMs(多模态模型)的竞赛中势均力敌。这些AI系统有独特的能力,可以无缝处理文本和图像,承诺从网页设计到数据分析的一切都将发生革命性的变化。虽然Google已经向一些第三方展示了即将推出的Gemini多模型模型的预览,但OpenAI也紧随其后,并计划在多模态能力方面超越Google进行公开发布。我们对强大的多模态模型的实验感到兴奋,并期待其在AI领域释放出新的能力和应用。

– Louie Peters — Towards AI联合创始人兼首席执行官

Towards X FlowGPT:提示黑客马拉松

我们很高兴宣布与FlowGPT合作,他们将于9月15日至10月14日期间举办提示黑客马拉松。加入他们的Discord社区,探索提示黑客马拉松。

他们将提供超过15000美元的奖励,此活动由Google赞助!此外,FlowGPT还将举办一些激动人心的AI/NLP相关活动。

我们还与FlowGPT合作,组织了我们的Learn AI Together Discord社区研讨会之一,Ruiqi Zhong将为大家提供有关AI对齐的见解。报名参加活动,了解更多信息。

最热门新闻

  1. 稳定音频

总部位于伦敦的初创公司Stability AI以其AI模型“稳定扩散”而闻名,现已推出“稳定音频”,这是一个能够更好地控制合成音频的高质量商业音乐生成AI模型。

2. 《The Information》报道:Google即将发布AI软件Gemini

Google即将发布其名为Gemini的对话AI软件。这是一个先进的语言模型,旨在与OpenAI的GPT-4模型竞争。目前处于早期测试阶段,提供了一系列功能,包括聊天机器人、文本摘要和代码编写辅助。

3. Microsoft发布Prompt Flow

Microsoft推出了基于LLM的应用程序开发套件Prompt Flow。它提供了一系列功能,包括创建可执行的工作流、调试和迭代工作流、使用更大的数据集评估工作流的质量和性能、将测试和评估集成到CI/CD系统中,以及轻松将工作流部署到选择的服务平台或应用程序代码库。

4. IBM发布MoE LLMs

IBM最近推出了具有40亿和80亿参数的MoE LLMs模型。这些模型在参数较少的情况下提供了与密集模型相当的计算效率。它们是在大型数据集上进行训练并采用ModuleFormer架构。

5. 普利策奖得主和其他人起诉OpenAI

普利策奖获得者、美国小说家迈克尔·查本(Michael Chabon)和其他几位作家已提起一项集体诉讼,指控OpenAI侵犯版权,声称OpenAI把他们的作品纳入了ChatGPT背后的模型训练数据集中。OpenAI辩称其语言学习模型受到“公平使用”的保护,引发了关于人工智能和版权法的讨论。

五个5分钟阅读/视频,助你不断学习

  1. LLM训练:RLHF及其替代方案。

本文逐步解析了RLHF的核心思想和重要性,提供了五种不同的方法和相应的研究论文,如宪法AI、后见之智、直接偏好优化等。

2. 新的AI使用数据显示谁在使用AI——并发现了一群“超级用户”。

Salesforce发布了生成式人工智能快照研究:“AI分裂”,该研究调查了来自美国、英国、澳大利亚和印度的4000多人。调查显示,近一半的人口使用它,其中三分之一每天使用。年轻一代,特别是Z世代和千禧一代,是生成式人工智能的“超级用户”。

3.🤗转换器中本地支持的量化方案概述。

转换器中的量化方案,如BitsandBytes和Auto-GPTQ,提供了在较小设备上运行大型模型的方法。本文旨在清晰概述转换器中支持的每种量化方案的优缺点,以帮助您决定应选择哪种方案。

4.为什么开源人工智能将取胜。

开源对于LLM和图像模型的未来影响可能比广大公众所认为的更大。本文介绍了目前对开源的争议和限制,并探讨了其未来和重要性。

5.验证大型语言模型的输出。LLM强大但可能产生不一致的结果。

对输出进行验证对于可靠和准确的应用程序至关重要。本文讨论了LLM输出验证,并提供了使用名为Guardrails AI的开源软件包来实现输出验证的示例。

论文和代码库

  1. 从稀疏到稠密:使用密度提示的GPT-4摘要

最近的一项研究引入了“Chain of Density”(CoD)提示技术,利用GPT-4生成稠密摘要。通过迭代添加重要实体而不增加长度,所得到的摘要摘要在抽象质量和减少引导偏差方面优于标准提示摘要。

2.用于编译器优化的大型语言模型

本文介绍了一个从头开始训练的7B参数变压器模型,用于优化LLVM汇编的代码大小。该模型超过了基准线,并展现出卓越的代码推理能力,导致指令计数减少了3%。它在91%的时间内生成可编译的代码,并在70%的时间内完美地模拟编译器的输出。

3.当少即是多:研究在大规模预训练LLM中修剪数据

在这项工作中,研究人员采用了更广泛的视角,探索可用于系统地测量预训练数据质量的可扩展估计方法。他们发现,对于修剪语言模型的预训练数据,困惑度比复杂的评分技术更有效。

4. NExT-GPT:任意到任意的多模态LLM

NExT-GPT是一个端到端的通用多模态LLM系统。它可以处理和生成文本、图像、视频和音频等各种模态的内容。它利用已经训练好的编码器和解码器来实现这一目标,只需进行最少的参数调整。

5.临床文本摘要:调整大型语言模型可以超越人类专家

这项工作在八个LLM上应用了领域自适应方法,涵盖了六个数据集和四个不同的摘要任务:放射学报告、患者问题、进展记录和医生-患者对话。这项研究首次证明了在多个临床摘要任务中,LLM优于人类。

喜欢这些论文和新闻摘要吗?在您的收件箱中获取每日回顾!

一起学习AI社区部分!

每周AI播客

在本周的“What’s AI”播客中,Louis Bouchard采访了DeepMind的研究科学家Petar Veličković。他们讨论了他的学术背景以及他从竞技编程到机器学习的转变过程。Petar还分享了关于博士学位的价值的见解,强调了它作为进入研究领域的入门券以及它提供的建立联系和适应性的机会的重要性。他强调了AI研究领域的不断发展,多样化的背景和贡献的重要性。总的来说,这次访谈提供了关于学术界、工业界以及好奇心在推动有影响力的研究方面的宝贵观点。在Spotify或Apple播客上收听完整的剧集!

即将举行的社区活动

Learn AI Together Discord社区举办每周AI研讨会,帮助社区从行业专家那里学习,提问,并深入了解AI领域的最新研究。通过参加我们即将举行的活动,免费参加在Discord上直播的互动视频会议,以获取更多的见解。

  1. 解释AI对齐

在网络研讨会上,钟锐琪将就AI对齐发表演讲,作为Prompt黑客马拉松系列活动的一部分,在服务器上托管。在演讲之前,了解更多有关钟锐琪和AI对齐的信息,请阅读他的文章“解释AI对齐:作为一名自然语言处理者,我为什么从事这项工作。”

点击此处加入活动!

日期和时间:2023年9月28日,美国东部时间下午12:00

将我们的谷歌日历添加到查看所有免费AI活动!

本周的梗图!

梗图由rucha8062分享

来自Discord的特色社区帖子

Penguin正在开发一个旨在更容易发现人工智能、机器学习、自然语言处理、计算机视觉和机器人技术的最新研究论文的网站。对于希望了解该领域最新研究的AI爱好者和专业人士来说,该网站是一个宝贵的资源。在这里查看并支持我们的社区成员!分享您的反馈并加入讨论。

本周的AI投票!

在Discord上加入讨论。

TAI精选栏目

本周文章

由Youssef Hosni撰写的本周重要计算机视觉论文

本文将全面介绍2023年9月第一周发布的最重要论文,突出计算机视觉领域的最新研究和进展。无论您是研究人员、从业者还是爱好者,本文都将为您提供有关计算机视觉领域的最新技术和工具的宝贵见解。

我们的必读文章

Florent Poux, Ph.D.撰写的《走向3D深度学习:使用Python的人工神经网络》

Sujeeth Kumaravel撰写的《PyTorch LSTM — 输入、隐藏状态、细胞状态和输出的形状》

David Winer撰写的《图注意力网络(GAT)的实现演示》

如果您有兴趣在Towards AI上发表文章,请查看我们的指南并注册。如果您的作品符合我们的编辑政策和标准,我们将在我们的网络上发布。

职位招聘

高级深度学习算法工程师@NVIDIA(美国加利福尼亚州圣克拉拉)

高级软件工程师 – Python后端@Teramind(远程)

高级深度学习NLP工程师@H1(远程)

资深机器学习研究员@Casetext(远程)

机器学习成功经理@Snorkel AI(远程)

软件工程师@Sonera(美国加利福尼亚州伯克利)

有兴趣在这里分享工作机会吗?请联系[email protected]

如果您正在准备下一次机器学习面试,请不要犹豫,访问我们领先的面试准备网站confetti!

https://www.confetti.ai/