Learn more about Applications - Section 26

2023年最佳8款人工智能照片混合器

Fotor Fotor最新发布的在线照片混合器为希望在两个图像之间实现艺术性无缝混合的用户提供了解决方案。这个工具非常适合增强社...

认识GETMusic:一个能够生成任何音乐曲目的统一表示和传播框架

近年来,使用机器学习模型生成音乐取得了显著进展。然而,在实现高效率和对结果的实质性控制方面仍存在挑战。以往的尝试主要...

使用LangChain掌握LLM应用程序的提示工程

介绍 在数字时代,基于语言的应用在我们的生活中发挥着至关重要的作用,驱动着诸如聊天机器人和虚拟助手等各种工具。通过使用...

DeepMind研究人员通过精确的数学定义重新定义了持续性强化学习

最近深度强化学习(RL)的进展已经展示了人工智能(AI)代理在各种令人印象深刻的任务上的超人表现。实现这些结果的当前方法...

这篇人工智能论文介绍了稳定签名:一种结合图像水印和潜在扩散模型的主动策略

最近发展的生成模型和自然语言处理使得逼真图像的创建和操作变得简单,使用诸如DALL’E 2和Stable Diffusion等工具。虽然生成A...

CMU研究人员推出WebArena:一个具有4+个真实世界Web应用的真实可重现的Web环境,用于测试有用代理的基准测试

鉴于提高效率和更广泛的可访问性的潜力,能够通过人类自然语言指令完成常规任务的自主代理可以极大地补充人类技能。为了充分...

深度学习用于深度对象:ZoeDepth是一个用于多领域深度估计的AI模型

你是否曾经遇到过一种错觉,其中图像中的孩子看起来比成年人更高更大?Ames房间错觉就是其中的一种,它涉及到一个形状像梯形...

FedML和Theta揭示了分散式AI超级集群:驱动生成式AI和内容推荐

在一项开创性的合作中,FedML和Theta Network联手推出了一个去中心化的人工智能超级集群,旨在改变生成式人工智能和内容推荐...

使用LangChain和OpenAI API构建生成性AI应用程序

介绍 生成式人工智能正在引领行业的最新技术浪潮。生成式人工智能应用,如图像生成、文本生成、摘要和问答机器人等,正在蓬勃...

微软AI团队发布了NaturalSpeech 2:一种基于潜在扩散模型的尖端TTS系统,具备强大的零样本语音合成和增强的表达式韵律

文本到语音(TTS)的目标是生成高质量、多样化的语音,听起来像真实的人说的。韵律、说话人身份(如性别、口音和音色)、说话...

基于深度学习的快速准确声音全息生成框架

由DGIST电子工程与计算机科学系的黄宰允教授领导的团队开发了一种基于深度学习的超声全息生成框架技术,可以实时根据全息图进...

“TEXTure相遇:一种用于3D网格的文本引导纹理的新型人工智能(AI)框架”

文本到图像生成是人工智能领域中一项新颖且迷人的研究领域,其目标是基于文本描述生成逼真的图像。从文本生成图像的能力具有...

Cohere推出Coral:为希望提高最具战略性团队生产力的企业提供知识助手

Cohere推出了Coral,这是一款专为战略团队提升生产力而量身定制的尖端企业知识助手。随着工作场所的变化,员工越来越希望以高...

使用AI框架“DreamPose”将时尚图像转化为惊人逼真的视频

时尚摄影在在线平台上广泛存在,包括社交媒体和电子商务网站。然而,作为静态图像,它们在提供关于服装的全面信息方面有限,...

遇见MACTA:一种开源的多智能体强化学习方法,用于缓存定时攻击和检测

我们被各种形式的数据淹没。无论是来自金融部门、医疗保健部门、教育部门还是组织机构的数据,数据的隐私和安全都是每个组织...

研究人员开发了一种新的无标记AI方法,可以使用视频录像来跟踪鸟类的3D姿势

追踪动物和鸟类的行为、凝视和微小运动一直是研究人员面临的挑战,因为目前仍然缺乏大量带有准确3D注释的多角度动物图像的数...

“先有梦想,后学习:DECKARD是一种利用LLMs训练强化学习(RL)智能体的AI方法”

强化学习(RL)是训练可以通过与环境交互学习完成复杂任务的自主代理的流行方法。RL使它们能够在不同条件下学习最佳动作,并...

中国研究人员提出了一种名为CarveMix的数据增强方法,用于脑损伤分割

使用卷积神经网络(CNN)进行自动脑损伤分割已成为有价值的临床诊断和研究工具。然而,基于CNN的方法在准确分割脑损伤方面仍...

斯坦福大学研究人员推出了Sophia:一种可扩展的语言模型预训练的二阶优化器

鉴于训练语言模型的高昂成本,对优化过程进行非平凡改进将极大地减少完成训练过程所需的时间和金钱。Adam及其变种长时间以来...