Learn more about Uncategorized - Section 14

在媒体中检测酒精暴露:评估CLIP的零样本学习与ABIDLA2深度学习在图像分析中的能力

酒精是一种普遍的健康问题,占全球疾病负担的5.1%,对个人和经济造成了重大负面影响。从社交媒体到电影、广告和流行音乐,酒...

这篇人工智能论文介绍了稳定签名:一种结合图像水印和潜在扩散模型的主动策略

最近发展的生成模型和自然语言处理使得逼真图像的创建和操作变得简单,使用诸如DALL’E 2和Stable Diffusion等工具。虽然生成A...

来自伦敦帝国理工学院和DeepMind的研究人员设计了一个人工智能框架,将语言作为强化学习智能体的核心推理工具

近年来,深度学习领域取得了重大突破,特别是在人工智能的热门子领域中,包括自然语言处理(NLP)、自然语言理解(NLU)和计...

CMU研究人员推出WebArena:一个具有4+个真实世界Web应用的真实可重现的Web环境,用于测试有用代理的基准测试

鉴于提高效率和更广泛的可访问性的潜力,能够通过人类自然语言指令完成常规任务的自主代理可以极大地补充人类技能。为了充分...

深度学习用于深度对象:ZoeDepth是一个用于多领域深度估计的AI模型

你是否曾经遇到过一种错觉,其中图像中的孩子看起来比成年人更高更大?Ames房间错觉就是其中的一种,它涉及到一个形状像梯形...

FedML和Theta揭示了分散式AI超级集群:驱动生成式AI和内容推荐

在一项开创性的合作中,FedML和Theta Network联手推出了一个去中心化的人工智能超级集群,旨在改变生成式人工智能和内容推荐...

微软AI团队发布了NaturalSpeech 2:一种基于潜在扩散模型的尖端TTS系统,具备强大的零样本语音合成和增强的表达式韵律

文本到语音(TTS)的目标是生成高质量、多样化的语音,听起来像真实的人说的。韵律、说话人身份(如性别、口音和音色)、说话...

基于深度学习的快速准确声音全息生成框架

由DGIST电子工程与计算机科学系的黄宰允教授领导的团队开发了一种基于深度学习的超声全息生成框架技术,可以实时根据全息图进...

微软发布TypeChat:一款使用类型构建自然语言接口变得简单的AI库

微软的TypeChat库是为了方便创建基于类型的大型语言模型(LLM)的自然语言接口而进行的尝试。TypeChat是一个GitHub项目,旨在...

“TEXTure相遇:一种用于3D网格的文本引导纹理的新型人工智能(AI)框架”

文本到图像生成是人工智能领域中一项新颖且迷人的研究领域,其目标是基于文本描述生成逼真的图像。从文本生成图像的能力具有...

Cohere推出Coral:为希望提高最具战略性团队生产力的企业提供知识助手

Cohere推出了Coral,这是一款专为战略团队提升生产力而量身定制的尖端企业知识助手。随着工作场所的变化,员工越来越希望以高...

使用AI框架“DreamPose”将时尚图像转化为惊人逼真的视频

时尚摄影在在线平台上广泛存在,包括社交媒体和电子商务网站。然而,作为静态图像,它们在提供关于服装的全面信息方面有限,...

遇见MACTA:一种开源的多智能体强化学习方法,用于缓存定时攻击和检测

我们被各种形式的数据淹没。无论是来自金融部门、医疗保健部门、教育部门还是组织机构的数据,数据的隐私和安全都是每个组织...

研究人员开发了一种新的无标记AI方法,可以使用视频录像来跟踪鸟类的3D姿势

追踪动物和鸟类的行为、凝视和微小运动一直是研究人员面临的挑战,因为目前仍然缺乏大量带有准确3D注释的多角度动物图像的数...

“先有梦想,后学习:DECKARD是一种利用LLMs训练强化学习(RL)智能体的AI方法”

强化学习(RL)是训练可以通过与环境交互学习完成复杂任务的自主代理的流行方法。RL使它们能够在不同条件下学习最佳动作,并...

中国研究人员提出了一种名为CarveMix的数据增强方法,用于脑损伤分割

使用卷积神经网络(CNN)进行自动脑损伤分割已成为有价值的临床诊断和研究工具。然而,基于CNN的方法在准确分割脑损伤方面仍...

斯坦福大学研究人员推出了Sophia:一种可扩展的语言模型预训练的二阶优化器

鉴于训练语言模型的高昂成本,对优化过程进行非平凡改进将极大地减少完成训练过程所需的时间和金钱。Adam及其变种长时间以来...

“见面TR0N:一种简单高效的方法,可以为预训练的生成模型添加任何类型的条件”

最近,大规模机器学习模型在各种任务中表现出色。然而,训练这样的模型需要大量的计算机计算能力。因此,正确有效地利用当前...

合成字幕对于多模态训练是否有用?这篇AI论文展示了合成字幕在提高多模态训练的字幕质量方面的有效性

多模态模型是人工智能领域的最重要进展之一。这些模型旨在处理和理解来自多种模态的数据,无论是视觉数据(包括图像和视频)...