Learn more about Editors Pick - Section 10

《遇见IBM的沃森X代码助手：通过人工智能支持彻底改变企业编码》

在当今快节奏的软件开发世界中，企业面临的关键挑战之一是需要快速、准确地编码。开发人员经常面对复杂的编码任务，找到实用...

HuggingFace推出TextEnvironments：一个机器学习模型和一组工具（Python函数）之间的协调器，模型可以调用这些工具来解决特定任务

Supervised Fine-tuning (SFT), Reward Modeling (RM), and Proximal Policy Optimization (PPO) are all part of TRL. In th...

谷歌AI引入Spectron：第一个经过端到端训练的口语AI模型，可以直接处理频谱图作为输入和输出

<img alt=”” src=”https://ai.miximages.com/www.marktechpost.com/wp-content/uploads/2023/11/Screen...

腾讯AI实验室推出了渐进条件扩散模型（PCDMs），通过三个阶段逐步缩小目标和源姿势下的人物图像之间的差距

姿势引导的人物图像合成研究领域近年来取得了重大进展，其重点是生成以不同姿势为特征但外貌相同的人物图像。这项技术在电子...

这篇AI论文揭示了上下文学习的秘密：语言模型如何将功能编码为向量魔法

在自回归变换器语言模型中，鉴定了一种被称为功能向量（FV）的紧凑向量作为输入输出函数的表示。因果中介分析应用于多样化的...

认识Wonder3D：一种新颖的人工智能方法，可以从单视角图像高效生成高保真带纹理的网格模型

从单个图像中重建3D几何形状代表了计算机图形学和3D计算机视觉领域的一项基础工作，正如之前的研究所显示的那样，这项任务具...

“加利福尼亚大学圣地亚哥分校研究人员发布TD-MPC2：革新多领域基于模型的强化学习”

大型语言模型（LLMs）在人工智能和机器学习的进步下不断改进。LLMs在人工智能的子领域，包括自然语言处理、自然语言理解、自...

认识HITL-TAMP：利用自动化规划和人工控制的混合策略教授机器人复杂的操纵技能的新AI方法

通过观察人类演示教授机器人复杂的操作技能已经取得了有希望的结果。提供详尽的操作演示需要时间和人力成本，使得将该范式扩...

这项人工智能研究介绍了DreamCraft3D：一种用于创建生成连贯且高保真度3D模型的分层方法

“`html 2D生成建模的惊人流行大大影响了他们生成视觉资料的方式。深度生成网络在创建3D图像时仍然存在很大困难，而这对...

Jina AI推出’jina-embeddings-v2’：全球首个8k开源文本嵌入模型

Jina AI发布了其第二代文本嵌入模型的最新进展：jina-embeddings-v2。这一先进的模型是目前唯一支持令人印象深刻的8K（8192个...

You.com发布了YouRetriever：最简单的与You.com搜索API互动的界面

You.com发布了YouRetriever，这是You.com搜索API的最简单接口。You.com搜索API是由LLMs为LLMs设计的，主要用于检索增强生成（...

苹果研究人员引入了一种突破性的人工智能方法，可以从动态姿态的RGB图像中进行稠密三维重建

“` 通过学习的先验，仅使用单目相机的RGB重建在解决低纹理区域和基于图像重建的固有模糊性问题方面取得了显著进展。实...

“ConvNet是否卷土重来？揭示其在大规模Web数据集和匹配视觉转换器上的性能”

研究人员挑战了计算机视觉领域中的主流观点，认为当视觉转换器（ViTs）获得大规模网络数据集的访问权限时，它们优于卷积神经...

如何使基于模型的基础保持最新数据？苹果和CMU的研究人员推出了第一个具有12.7B个时间戳图像-文本对的网络规模时间连续（TiC）基准，用于VLM的持续训练

“`html 大规模多模态基础模型如CLIP、Flamingo和Stable Diffusion的贡献引发了多模态学习的范式变革，使图像生成和零样...

哥伦比亚大学和苹果公司的研究人员推出了Ferret：一种突破性的多模态语言模型，用于高级图像理解和描述

如何促进模型的空间知识是视觉语言学习中的一个重要研究问题。这个困境要求两种必备能力：引用和基础。基础要求模型根据提供...

“见面吧GROOT：基于视觉的操纵的强大仿真学习框架，具有以物体为中心的三维先验知识和自适应策略泛化”

随着人工智能的流行和应用案例增加，模仿学习（IL）已经被证明是一种成功的技术，用于教授基于神经网络的视觉运动策略，以执...

遇见尤里卡：由大型语言模型（LLMs）驱动的人类级奖励设计算法

大型语言模型（LLMs）在高级规划方面表现出色，但需要帮助掌握低级任务，如旋转笔技巧。然而，NVIDIA、UPenn、Caltech和UT Au...

人工智能生成内容（AIGC）中的视频扩散模型综述

“`html 人工智能正在蓬勃发展，计算机视觉作为其子领域也是如此。从研究人员、学者到学者，它引起了很多关注，并对许多...

据耶鲁大学和Google DeepMind的研究人员使用先进的微调技术在大型语言模型上取得了数学问题解决的成功

即使是最先进的大型语言模型（LLMs），如GPT-4和PaLM 2，也很难解决数学问题，因为这需要想象力、数学推理和计算。当LLMs被允...

《来自华盛顿大学和NVIDIA的研究人员提出的人形智能代理：一种用于生成型代理的人类模拟的人工智能平台》

类人生成代理通常用于聊天机器人和虚拟助手，以提供自然而引人入胜的用户互动。它们能够理解和回答用户的查询，参与对话，并...

Image Description

Your AI Partner

Image Description

Exploring the future with AI

Web Analytics