Learn more about AI Shorts - Section 3

纽约大学的研究人员提出了GPQA：一项挑战性的数据集，其中包含由生物学、物理学和化学领域的专家编写的448道多项选择题

大型语言模型（LLMs）正在人工智能（AI）领域处于前沿，显示出超越人类技能的巨大潜力。但是，当这些模型接近超人类能力时，...

遇见Vchitect：一款用于文本到视频（T2V）和图像到视频（I2V）应用的开源大规模综合视频创作系统

最近，人工智能（AI）的普及度呈指数增长，这导致了深度生成模型的一些重大进展。这些模型已应用于视频生成领域，用于创造图...

Adobe 研究人员提出了 DMV3D：一种新颖的 3D 生成方法，使用基于 Transformer 的 3D 大型重建模型来去噪多视角扩散

在增强现实（AR）、虚拟现实（VR）、机器人技术和游戏领域中，3D资产创建面临着一个普遍的挑战。3D扩散模型的流行度激增，该...

这项AI研究推出了CoDi-2：一种突破性的多模态大型语言模型，改变了交错指令处理和多模态输出生成的领域

研究人员在加州大学伯克利分校、微软Azure AI、Zoom和北卡罗来纳大学教堂山分校共同开发了CoDi-2多模态大语言模型（MLLM），...

MIT和Adobe的研究人员介绍了Distribution Matching Distillation（DMD）：一种人工智能方法，可以将扩散模型转化为一步生成图像的方法

通过稳定的训练过程，扩散模型已经改变了图片生成的方式，实现了以往无法想象的多样性和真实度。但与GAN和VAE不同，扩散模型...

谷歌研究人员揭示通用自洽性（USC）：为复杂任务性能提供大型语言模型的新飞跃

Google的研究人员通过他们的Universal Self-Consistency（USC）方法解决了在任务性能上增强数学推理和代码生成等任务中从多个...

顶级人工智能电子邮件助手（2023年12月）

人工智能电子邮件助手使编写电子邮件更快更容易。自动任务完成，消息优先级和即时，深入的答案只是人工智能电子邮件助手如何...

少量数据标注 + 更多 AI = 深度主动学习

训练人工智能（AI）模型通常需要大量标记数据。这可能非常昂贵和耗时，尤其是对于像图像识别或自然语言处理这样的复杂任务。...

“认识Ego-Exo4D：一套支持视频学习和多模式感知研究的基础数据集和基准套件”

如今，人工智能几乎应用于几乎所有可以想象的领域。它无疑改变了我们的生活，使过程更加简化，效率更高，这是我们之前无法想...

腾讯AI实验室推出GPT4Video：一种统一的多模态大型语言模型，用于指导跟踪理解和安全感知生成

“`html 解决视频理解和生成场景的问题，由腾讯AI实验室和悉尼大学的研究人员提出了GPT4Video。这个统一的多模型框架支...

谷歌AI研究呈现Translatotron 3：一种新颖的无监督语音到语音翻译架构

语音到语音翻译（S2ST）是一项破解语言障碍的变革性技术，但是平行语音数据的稀缺性阻碍了其进展。大多数现有模型需要监督设...

马克斯·普朗克研究人员推出PoseGPT：一种使用大型语言模型（LLMs）来理解和推理图像或文本描述中的3D人体姿势的人工智能框架

人的姿势对整体健康、幸福和生活的各个方面至关重要。它包括坐、站或躺时身体的对齐和定位。良好的姿势支持肌肉、关节和韧带...

关于小型语言模型（SLM）及其应用的一切你需要了解的事情

大型语言模型（LLMs），如GPT、PaLM、LLaMA等，因其令人难以置信的能力而受到广泛关注。它们利用自然语言处理、生成和理解的...

稳定性AI推出了SDXL Turbo 一款实时文本到图片生成模型

Stability AI推出SDXL Turbo，这是一种在文本到图像合成领域取得重大突破的创新蒸馏方法——敌对扩散蒸馏（ADD）。这一突破使得...

认识DreamSync：一种新的人工智能框架，通过从图像理解模型中获得反馈来改善文本到图像（T2I）合成

“`html 来自南加利福尼亚州大学、华盛顿大学、巴尔幸大学和谷歌研究的研究人员介绍了DreamSync，该技术解决了扩散型文...

高通AI研究的这篇AI论文揭示了EDGI：一种开创性的均匀扩散器，用于先进的基于模型的强化学习和高效规划

无处不在的对称性。物理学的普遍原则适用于空间和时间。当空间坐标被平移、旋转和时间平移时，它们表现出对称性。此外，如果...

深入探究关系数据库及其应用

今天，在各种通常不相关的类别下存储海量数据的需求凸显了高效数据库的重要性。数据库是一个精心组织、结构化和存储的数据集...

DeepSeek公开源代码DeepSeek-67B模型：中国最新的ChatGPT竞争者

中国人工智能初创公司DeepSeek AI通过推出DeepSeek LLM系列开启了大型语言模型（LLMs）的新时代。由DeepSeek LLM 7B/67B Base...

CMU研究人员发现神经网络行为的关键洞见：重尾数据和网络深度在塑造优化动力学方面的相互作用

神经网络（NN）优化具有令人着迷的特性，这些特性无法用优化的经典工具轻易解释。研究团队对于每个特性的机械原因有不同程度...

这篇AI论文发布了对开源大规模语言模型的详细评价，这些模型声称在不同任务中赶超或超越了ChatGPT

“`html 去年ChatGPT的发布引起了人工智能界的轰动。基于GPT的Transformer架构，这是最新的大型语言模型，ChatGPT在学术...

Image Description

Your AI Partner

Image Description

Exploring the future with AI

Web Analytics