Learn more about Computer vision - Section 8

一致性AI视频编辑器已经到来:TokenFlow是一种使用扩散特征进行一致视频编辑的AI模型

扩散模型是您现在应该熟悉的内容。它们在过去一年中成为人工智能领域的关键话题。这些模型在图像生成方面取得了显著的成功,...

这项人工智能研究介绍了一种新颖的两阶段姿势提取方法,用于全身姿势估计

众多以人为中心的感知、理解和创造任务依赖于全身姿势估计,包括3D全身网格恢复、人物对象交互和姿势条件下的人体图像和动作...

‘nnU-Net终极指南’

深入研究我们关于nnU-Net的全面指南,这是图像分割领域的领先工具掌握实现最先进结果的知识

巴黎索邦大学研究人员推出UnIVAL:一种用于图像、视频、音频和语言任务的统一AI模型

创建通用模型的一个重大进展是出现了大型语言模型(LLMs)。它们惊人的文本理解和生成性能通常基于Transformer架构和单个下一...

大图像模型中的最新CNN内核

由于OpenAI的ChatGPT取得了显著的成功,引发了大型语言模型的热潮,许多人预见到大型图像模型将是下一次突破在这个领域中,视...

“见证创造者:开发者将NVIDIA Jetson视为AI动力学坑道机器人的核心”

Goran Vuksic是建造真实世界坑道机器人的项目的幕后推手,坑道机器人是一种修理和维护穿越星球大片系列的赛车的机器人。 这位...

“认识 Med-Flamingo:一种独特的基础模型,能够进行针对医学领域的多模态上下文学习”

随着人工智能(AI)的日益普及,基础模型展现了令人惊讶的能力,只需提供少量标记实例的信息就能处理各种问题。在上下文学习...

一项关于利用扩散模型在图像之间融合插值的人工智能研究

人工智能是开发人员和研究人员最新的讨论话题。从自然语言处理和自然语言理解到计算机视觉,人工智能正在革新几乎所有领域。...

不是 NeRF 需要的英雄,但是是 NeRF 需要的英雄:CopyRNeRF 是一种保护 NeRF 版权的 AI 方法

如果你一直关注计算机图形领域的发展,你应该对神经辐射场(NeRFs)非常熟悉。它们已经成为了一种有前途的技术,可以表示3D场...

麻省理工学院研究人员推出PhotoGuard:一种新的AI工具,可以防止未经授权的图像篡改

在一个人工智能技术可以模糊现实与制造之间界限的世界中,滥用的风险随之而来。像DALL-E和Midjourney这样的先进生成模型降低...

“认识MC-JEPA:一种联合嵌入预测架构,用于自监督学习运动和内容特征”

最近,专注于学习内容特征的技术,特别是那些包含让我们能够识别和区分对象的信息的特征,在视觉上的自我监督学习中占据主导...

UC Berkeley研究人员推出了Nerfstudio:用于神经辐射场(NeRF)开发的Python框架

谁不是钢铁侠的粉丝呢?当他在实验室工作时,他看起来非常酷。他使用的全息影像和新式装备使他看起来很酷。能否从一张二维照...

基于光的计算革命:利用增强的光学神经网络为ChatGPT类型的机器学习程序提供动力

ChatGPT的能力可以根据几个简单的问题生成精细的文章、电子邮件和代码,引起了国际关注。麻省理工学院的研究人员报道了一种方...

这篇人工智能论文介绍了稳定签名:一种结合图像水印和潜在扩散模型的主动策略

最近发展的生成模型和自然语言处理使得逼真图像的创建和操作变得简单,使用诸如DALL’E 2和Stable Diffusion等工具。虽然生成A...

研究人员开发了一种新的无标记AI方法,可以使用视频录像来跟踪鸟类的3D姿势

追踪动物和鸟类的行为、凝视和微小运动一直是研究人员面临的挑战,因为目前仍然缺乏大量带有准确3D注释的多角度动物图像的数...

使用预训练的文本到图像扩散模型完成点云补全

你听说过点云这个术语吗?它是三维数据的基本表示,由三维坐标系中的点组成,描述了物体或环境的几何和空间属性。由于提供了...