Learn more about Computer vision - Section 11

UC Berkeley和Meta AI研究人员提出了一种拉格朗日动作识别模型,通过融合3D姿态和上下文化外观来跟踪轨迹

在流体力学中,惯性系和欧拉系的流场表示是惯例。根据维基百科,“流场的拉格朗日描述是一种研究流体运动的方法,其中观察者跟...

认识CoDi:一种新的跨模态扩散模型,可用于任意合成

在过去的几年中,出现了一些强大的交叉模态模型,能够从一种信息中生成另一种信息,例如将文本转换为文本、图像或音频。一个...

来自萨里大学的研究人员推出了一款基于素描的机器学习物体检测工具,具有颠覆性的影响

自史前时代起,人们就用草图进行交流和文件记录。在过去的十年中,研究人员在理解如何使用草图从分类和合成到更新颖的应用,...

这篇人工智能论文研究了匿名化对无人驾驶数据集训练计算机视觉模型的影响

图像去匿名化是指从图像中修改或删除敏感信息以保护隐私。虽然这对于遵守隐私法规非常重要,但匿名化通常会降低数据质量,从...

来自马里兰大学学院市分校的最新人工智能研究开发出了一种人工智能系统,可以从人眼中的反射中重建三维场景

人眼是一种奇妙的器官,允许视觉并存储重要的环境数据。它们通常将它们的眼睛用作两个镜头,以将光线引导到组成视网膜的感光...

了解CapPa:DeepMind的创新图像字幕策略,正在改变视觉预训练并与CLIP在可扩展性和学习性能方面展开竞争

一篇最近的论文,名为“图像字幕生成器也是可扩展的视觉学习者”,提出了一种有趣的方法,称为CapPa,旨在将图像字幕生成作为视...

认识TRACE:一种新的人工智能方法,使用全局坐标跟踪实现准确的三维人体姿态和形状估计

许多领域可以从最近估计的三维人体姿态和形状(HPS)的进展中受益并使用。然而,大多数方法只考虑一帧图像,估计相对于相机的...

使用新的计算机视觉技术学习姿态估计

介绍 在图像或视频序列中找到并跟踪重要身体关节或关键点的位置是姿态检测的任务,通常称为姿态估计或关键点检测。它旨在理解...

使用人工智能和计算机视觉检测癌症生长

乳腺癌是女性中最致命的癌症之一根据世界卫生组织(WHO)的数据,仅在2020年,就诊断出了约230万例浸润性乳腺癌……

AI看到你看到的:Mind’s Eye是一种AI模型,可以将脑部扫描重建成图像

我们一直被理解大脑如何运作的挑战所吸引。神经科学领域已经取得了很大的进展,但我们仍然缺乏关于我们的大脑如何工作的可靠...

通过人类关注预测模型实现令人愉悦的用户体验

Google Research的高级研究科学家Junfeng He和员工研究科学家Kai Kohlhoff发布了这篇文章。 人类有着惊人的能力,可以接受大...

揭秘DreamBooth:个性化文本到图像生成的新工具

想象一下,在雅典卫城的背景下,轻松生成一张你心爱小狗的新图片时的喜悦还不满足,你想看看梵高会如何画...

中国的研究人员介绍了Make-Your-Video:一种通过使用文本和结构指导进行视频转换的方法

视频是一种常用的数字媒介,因其能够呈现生动有趣的视觉体验而备受青睐。随着智能手机和数码相机的普及,用相机记录现场事件...

苹果研究员推出ByteFormer:一种仅使用字节并不显式地建模输入方式的AI模型

深度学习推理通常需要明确建模输入模态。例如,通过将图片补丁编码为向量,Vision Transformers (ViTs) 直接模拟了图像的二维...