Learn more about Editors Pick - Section 38

从声音到视觉：了解用于音频到图像合成的AudioToken

神经生成模型改变了我们消费数字内容的方式，彻底改变了各个方面。它们具有生成高质量图像的能力，确保长篇文本的连贯性，甚...

新兴能力揭示：只有成熟的AI像GPT-4才能自我改进吗？探索语言模型自主增长的影响

研究人员正在调查，类似于AlphaGo Zero，其中AI代理通过反复参与具有明确规则的竞争游戏来发展自己，许多大型语言模型（LLM）...

了解CapPa：DeepMind的创新图像字幕策略，正在改变视觉预训练并与CLIP在可扩展性和学习性能方面展开竞争

一篇最近的论文，名为“图像字幕生成器也是可扩展的视觉学习者”，提出了一种有趣的方法，称为CapPa，旨在将图像字幕生成作为视...

通过MINILLM揭示人工智能的潜力：深入探讨从更大的语言模型到更小的对应模型的知识蒸馏

知识蒸馏是一种典型的策略，通过大型教师模型的监督训练小型学生模型来减少由于大型语言模型的快速发展而导致的过度计算资源...

6 个 AI 功能将 Gmail 变为高效的电子邮件解决方案

谷歌的Gmail一直是利用人工智能（AI）增强用户体验的领导者。凭借整合AI到其平台的历史，Gmail不断发展，提供一系列简化电子...

认识TRACE：一种新的人工智能方法，使用全局坐标跟踪实现准确的三维人体姿态和形状估计

许多领域可以从最近估计的三维人体姿态和形状（HPS）的进展中受益并使用。然而，大多数方法只考虑一帧图像，估计相对于相机的...

友谊结束了，单模态已经不再是我的好朋友：CoDi是一种人工智能模型，可以通过可组合扩散实现任何到任何的生成

生成式AI是我们现在几乎每天都听到的术语。我甚至不记得我读过多少关于生成式AI的论文，并在这里总结了它们。它们令人印象深...

SalesForce AI研究员推出无需遮罩的OVIS：一种开放词汇实例分割遮罩生成器

实例分割指的是计算机视觉任务，即通过将它们视为不同的实体，将属于同一类别的多个对象在图像中进行识别和区分。在深度学习...

WAYVE 推出 GAIA-1 一种新的生成式人工智能模型，通过利用视频、文本和动作输入，创建逼真的驾驶视频，实现自主驾驶

汽车工业一直追求自动驾驶的目标，认识到其在改革交通和提高道路安全方面的潜力。然而，开发能够有效地在复杂的现实情景中导...

需要作为数据科学家成功的软技能

当你在成为一名数据科学家的职业道路上努力时，很容易将注意力集中在硬技能上你可能想学习一个新的机器学习算法，比如带有非...

动态重连延迟消息传递图神经网络

这篇文章是与Francesco Di Giovanni和Ben Gutteridge合作撰写的，基于B. Gutteridge等人的论文《DRew：具有延迟的动态重连消...

这篇来自谷歌的AI论文提出了一系列优化措施，通过在各种设备上执行大型扩散模型，共同实现了突破性的延迟指标

随着大型扩散模型在图像生成中变得更加普遍，模型大小和推理工作量已经大幅增长。由于资源限制，在移动环境中优化设备上的ML...

2023年最佳AI销售助手工具

人工智能销售助手解决方案，通常是虚拟销售助手，通过自动化各种职责来帮助销售代表。使用这些AI驱动的销售工具，销售和营销...

Meta AI通过Voicebox打破了障碍：一个前所未有的生成式人工智能模型——革命性地改变了语音合成领域

元学习研究人员最近在生成语音的生成AI方面取得了重大突破。他们开发了Voicebox，一种创新的AI模型，展示了最先进的性能和在...

微软研究人员提出BioViL-T：一种新颖的自我监督框架，引入了在生物医学应用中提高预测性能和数据效率的增强型技术

人工智能（AI）已经成为许多行业的重要破坏性力量，从技术企业的运营方式到如何在医疗保健领域的不同子领域中解锁创新。特别...

认识 TARDIS：一种人工智能框架，可以识别复杂空间中的奇异性，捕捉图像数据中的奇异结构和局部几何复杂性

我们从各个领域，包括科学、医学、社交媒体和教育数据中获取了大量的数据。分析这些数据是至关重要的。随着数据量的增加，从...

深入探究统计期望的科学

我们如何以及为什么对某事产生期望，期望意味着什么，以及导致其意义的数学

来自微软和加州大学圣塔芭芭拉分校的研究人员提出了LONGMEM：一种人工智能框架，使LLMs能够记忆长期历史

大型语言模型（LLMs）极大地改进了各种理解和生成任务的最新技术，彻底变革了自然语言处理。大多数LLMs通过从固定大小的本地...

本文测试了ChatGPT的幽默感：超过90％的ChatGPT生成的笑话都是同样的25个笑话

幽默可以提高人类的表现和动机，对于建立关系至关重要。它是影响心情和引导注意力的有效工具。因此，计算幽默具有极大的潜力...

认识FinGPT：一种开源的金融大型语言模型（LLMs）

由于人工智能的不断发展和进步，大型语言模型得到了增强，这对自然语言处理在各个领域产生了深刻的影响。在这场激进的颠覆中...

Image Description

Your AI Partner

Image Description

Exploring the future with AI

Web Analytics