Learn more about Applications - Section 3

遇见Vchitect：一款用于文本到视频（T2V）和图像到视频（I2V）应用的开源大规模综合视频创作系统

最近，人工智能（AI）的普及度呈指数增长，这导致了深度生成模型的一些重大进展。这些模型已应用于视频生成领域，用于创造图...

Adobe 研究人员提出了 DMV3D：一种新颖的 3D 生成方法，使用基于 Transformer 的 3D 大型重建模型来去噪多视角扩散

在增强现实（AR）、虚拟现实（VR）、机器人技术和游戏领域中，3D资产创建面临着一个普遍的挑战。3D扩散模型的流行度激增，该...

这项AI研究推出了CoDi-2：一种突破性的多模态大型语言模型，改变了交错指令处理和多模态输出生成的领域

研究人员在加州大学伯克利分校、微软Azure AI、Zoom和北卡罗来纳大学教堂山分校共同开发了CoDi-2多模态大语言模型（MLLM），...

MIT和Adobe的研究人员介绍了Distribution Matching Distillation（DMD）：一种人工智能方法，可以将扩散模型转化为一步生成图像的方法

通过稳定的训练过程，扩散模型已经改变了图片生成的方式，实现了以往无法想象的多样性和真实度。但与GAN和VAE不同，扩散模型...

谷歌研究人员揭示通用自洽性（USC）：为复杂任务性能提供大型语言模型的新飞跃

Google的研究人员通过他们的Universal Self-Consistency（USC）方法解决了在任务性能上增强数学推理和代码生成等任务中从多个...

顶级人工智能电子邮件助手（2023年12月）

人工智能电子邮件助手使编写电子邮件更快更容易。自动任务完成，消息优先级和即时，深入的答案只是人工智能电子邮件助手如何...

少量数据标注 + 更多 AI = 深度主动学习

训练人工智能（AI）模型通常需要大量标记数据。这可能非常昂贵和耗时，尤其是对于像图像识别或自然语言处理这样的复杂任务。...

与ChatGPT相对应的是谷歌的Gemini

在不断发展的人工智能世界中，谷歌通过其最新的创作Gemini AI迈出了重大的一步。据谷歌称，Gemini 是他们目前最具能力和通用...

“认识Ego-Exo4D：一套支持视频学习和多模式感知研究的基础数据集和基准套件”

如今，人工智能几乎应用于几乎所有可以想象的领域。它无疑改变了我们的生活，使过程更加简化，效率更高，这是我们之前无法想...

腾讯AI实验室推出GPT4Video：一种统一的多模态大型语言模型，用于指导跟踪理解和安全感知生成

“`html 解决视频理解和生成场景的问题，由腾讯AI实验室和悉尼大学的研究人员提出了GPT4Video。这个统一的多模型框架支...

谷歌AI研究呈现Translatotron 3：一种新颖的无监督语音到语音翻译架构

语音到语音翻译（S2ST）是一项破解语言障碍的变革性技术，但是平行语音数据的稀缺性阻碍了其进展。大多数现有模型需要监督设...

马克斯·普朗克研究人员推出PoseGPT：一种使用大型语言模型（LLMs）来理解和推理图像或文本描述中的3D人体姿势的人工智能框架

人的姿势对整体健康、幸福和生活的各个方面至关重要。它包括坐、站或躺时身体的对齐和定位。良好的姿势支持肌肉、关节和韧带...

关于小型语言模型（SLM）及其应用的一切你需要了解的事情

大型语言模型（LLMs），如GPT、PaLM、LLaMA等，因其令人难以置信的能力而受到广泛关注。它们利用自然语言处理、生成和理解的...

稳定性AI推出了SDXL Turbo 一款实时文本到图片生成模型

Stability AI推出SDXL Turbo，这是一种在文本到图像合成领域取得重大突破的创新蒸馏方法——敌对扩散蒸馏（ADD）。这一突破使得...

认识DreamSync：一种新的人工智能框架，通过从图像理解模型中获得反馈来改善文本到图像（T2I）合成

“`html 来自南加利福尼亚州大学、华盛顿大学、巴尔幸大学和谷歌研究的研究人员介绍了DreamSync，该技术解决了扩散型文...

高通AI研究的这篇AI论文揭示了EDGI：一种开创性的均匀扩散器，用于先进的基于模型的强化学习和高效规划

无处不在的对称性。物理学的普遍原则适用于空间和时间。当空间坐标被平移、旋转和时间平移时，它们表现出对称性。此外，如果...

ChatGPT 基础知识：你需要的数据科学备忘单

简介欢迎来到数据科学的世界，算法、统计和领域专业技术融合在一起，从大型数据集中提取有意义的见解。在这个技术进步的时代...

DeepSeek公开源代码DeepSeek-67B模型：中国最新的ChatGPT竞争者

中国人工智能初创公司DeepSeek AI通过推出DeepSeek LLM系列开启了大型语言模型（LLMs）的新时代。由DeepSeek LLM 7B/67B Base...

CMU研究人员发现神经网络行为的关键洞见：重尾数据和网络深度在塑造优化动力学方面的相互作用

神经网络（NN）优化具有令人着迷的特性，这些特性无法用优化的经典工具轻易解释。研究团队对于每个特性的机械原因有不同程度...

这篇AI论文发布了对开源大规模语言模型的详细评价，这些模型声称在不同任务中赶超或超越了ChatGPT

“`html 去年ChatGPT的发布引起了人工智能界的轰动。基于GPT的Transformer架构，这是最新的大型语言模型，ChatGPT在学术...

Image Description

Your AI Partner

Image Description

Exploring the future with AI

Web Analytics