Learn more about Uncategorized - Section 24

10款公共关系(PR)2023年的人工智能工具

ChatGPT 简单来说,ChatGPT是一个AI驱动的会话用户界面。它接受用户的输入,分析它,并生成答案。OpenAI技术使机器能够理解书...

认识CoDi:一种新的跨模态扩散模型,可用于任意合成

在过去的几年中,出现了一些强大的交叉模态模型,能够从一种信息中生成另一种信息,例如将文本转换为文本、图像或音频。一个...

来自萨里大学的研究人员推出了一款基于素描的机器学习物体检测工具,具有颠覆性的影响

自史前时代起,人们就用草图进行交流和文件记录。在过去的十年中,研究人员在理解如何使用草图从分类和合成到更新颖的应用,...

这篇人工智能论文研究了匿名化对无人驾驶数据集训练计算机视觉模型的影响

图像去匿名化是指从图像中修改或删除敏感信息以保护隐私。虽然这对于遵守隐私法规非常重要,但匿名化通常会降低数据质量,从...

遇见DeepMind的Robocat:一个新的AI模型,旨在操作多个机器人

机器人正在迅速进入主流文化,然而它们通常因为编程而受到能力的限制。尽管将最近的 AI 进展融入到机器人设计中的潜在益处,...

来自马里兰大学学院市分校的最新人工智能研究开发出了一种人工智能系统,可以从人眼中的反射中重建三维场景

人眼是一种奇妙的器官,允许视觉并存储重要的环境数据。它们通常将它们的眼睛用作两个镜头,以将光线引导到组成视网膜的感光...

革命性的药物研发:机器学习模型识别潜在的延缓衰老化合物,为未来复杂疾病治疗铺平道路

衰老和其他疾病,如癌症、2型糖尿病、骨关节炎和病毒感染,都涉及到细胞衰老作为应激反应。有针对性地清除老化细胞正在变得越...

从声音到视觉:了解用于音频到图像合成的AudioToken

神经生成模型改变了我们消费数字内容的方式,彻底改变了各个方面。它们具有生成高质量图像的能力,确保长篇文本的连贯性,甚...

新兴能力揭示:只有成熟的AI像GPT-4才能自我改进吗?探索语言模型自主增长的影响

研究人员正在调查,类似于AlphaGo Zero,其中AI代理通过反复参与具有明确规则的竞争游戏来发展自己,许多大型语言模型(LLM)...

了解CapPa:DeepMind的创新图像字幕策略,正在改变视觉预训练并与CLIP在可扩展性和学习性能方面展开竞争

一篇最近的论文,名为“图像字幕生成器也是可扩展的视觉学习者”,提出了一种有趣的方法,称为CapPa,旨在将图像字幕生成作为视...

通过MINILLM揭示人工智能的潜力:深入探讨从更大的语言模型到更小的对应模型的知识蒸馏

知识蒸馏是一种典型的策略,通过大型教师模型的监督训练小型学生模型来减少由于大型语言模型的快速发展而导致的过度计算资源...

6 个 AI 功能将 Gmail 变为高效的电子邮件解决方案

谷歌的Gmail一直是利用人工智能(AI)增强用户体验的领导者。凭借整合AI到其平台的历史,Gmail不断发展,提供一系列简化电子...

认识TRACE:一种新的人工智能方法,使用全局坐标跟踪实现准确的三维人体姿态和形状估计

许多领域可以从最近估计的三维人体姿态和形状(HPS)的进展中受益并使用。然而,大多数方法只考虑一帧图像,估计相对于相机的...

SalesForce AI研究员推出无需遮罩的OVIS:一种开放词汇实例分割遮罩生成器

实例分割指的是计算机视觉任务,即通过将它们视为不同的实体,将属于同一类别的多个对象在图像中进行识别和区分。在深度学习...