Learn more about Tech News - Section 3

微软研究员提出神经图模型（NGMs）：一种新型的概率图模型（PGM），它通过深度神经网络学习表示域上的概率函数

在不确定性推理领域，概率图模型（PGMs）长期以来一直是数据分析的重要工具。这些模型提供了一个结构化框架，用于表示数据集...

这项AI研究提出了LayoutNUWA：一种将布局生成视为代码生成任务的AI模型，以增强语义信息并利用大型语言模型（LLMs）的隐藏布局专长

随着LLMs的增长，对LLMs的各个方面进行了彻底的研究。因此，图形布局也进行了研究。图形布局，即设计元素的排列和放置方式，...

抖音推出AI标注工具，用于AI生成的内容

近年来，AI生成内容的爆发开启了创意表达的新领域。然而，这股合成媒体的激增也引发了观众对透明度和理解的担忧。本周，TikTo...

UCSD研究人员开源了Graphologue：一种独特的AI技术，可以将诸如GPT-4响应之类的大型语言模型实时转化为交互式图表

大型语言模型（LLMs）由于其易于获取和出色的生成文本响应能力而近来备受瞩目，可为各种用户查询提供答案。超过十亿人使用了...

在视觉Transformer中的ReLU与Softmax：序列长度是否重要？来自Google DeepMind研究论文的见解

一个常见的机器学习架构是变压器架构。变压器的主要部分之一是注意力，它具有生成跨标记的概率分布的softmax。由于指数计算和...

图像匿名化如何影响计算机视觉性能？探索传统与现实匿名化技术

图像匿名化是通过遮蔽可识别特征来保护个人隐私的一种方式。随着数字时代的进展，保护图像中的个人数据的需求越来越迫切。然...

Deci AI推出DeciDiffusion 1.0：一个8.2亿参数的文本到图像潜在扩散模型，速度比稳定扩散快3倍

定义问题文本到图像生成一直是人工智能领域的一个挑战。将文本描述转化为生动、逼真的图像是迈向自然语言理解和视觉内容创作...

大型语言模型在长篇问答中的表现如何？Salesforce研究人员对LLM的鲁棒性和能力进行了深入探究

尽管ChatGPT和GPT-4等大型语言模型（LLMs）在多个基准测试中表现出更好的性能，但MMLU和OpenLLMBoard等开源项目在多个应用和...

斯坦福大学的研究介绍了PointOdyssey：一个用于长期点跟踪的大规模合成数据集

大规模注释的数据集已经成为各种计算机视觉任务中创建精确模型的高速公路。他们希望在这项研究中提供这样一条高速公路，以实...

Google DeepMind推出一种新的AI工具，可以对7100万个“错义”突变的影响进行分类

人类遗传学面临的最大挑战可以说是人类基因组的复杂性以及对健康和疾病有贡献的大量遗传因素的多样性。人类基因组由30亿个碱...

解锁电池优化：机器学习和纳米级X射线显微镜技术如何改变锂电池

一项开创性的倡议从著名研究机构中涌现出来，旨在揭开锂离子电池复杂的奥秘。研究人员采用创新的方法，利用机器学习精确地分...

这篇由微软和清华大学进行的人工智能研究介绍了EvoPrompt：一种新颖的人工智能框架，用于自动离散提示优化，连接LLMs和进化算法

大型语言模型（LLMs）在几乎所有自然语言处理（NLP）任务上都表现出色。然而，传统的微调方法对LLMs来说代价高昂，因此发展了...

东京大学的研究人员引入了一种新技术，用于保护基于人工智能的敏感应用程序免受攻击

近年来，人工智能（AI）的快速发展导致其在计算机视觉、音频识别等各个领域的广泛应用。这种使用的激增已经彻底改变了产业，...

AI能在创造性思维任务上胜过人类吗？这项研究为人类与机器学习创造力之间的关系提供了深入的见解

虽然AI在许多领域取得了巨大的进展，并成为一种有价值的工具，但它并不能替代人类独特的品质和能力。在许多情况下，最有效的...

OpenAI公布了DALL·E 3：文本到图像生成的革命性跃进

在技术上的一次重大飞跃中，OpenAI宣布推出了DALL·E 3，这是他们开创性的文本到图像生成技术的最新版本。DALL·E 3具备前所未...

IBM研究人员提出了一种新的对抗性攻击框架，能够针对AI系统生成对抗性输入，无论其模态或任务如何

在人工智能不断发展的领域中，出现了一个越来越令人关注的问题：AI模型对对抗性躲避攻击的脆弱性。这些狡猾的攻击可以通过微...

遇见 StableSR：一种利用预训练扩散模型的新型AI超分辨率方法

计算机视觉领域的图像合成任务的扩散模型的发展取得了显著进展。先前的研究已经说明了将扩散先验集成到稳定扩散等合成模型中...

“视频分割可以更具成本效益吗？认识DEVA：一种解耦的视频分割方法，可以节省注释并在不同任务之间泛化”

你是否曾经想过监控系统是如何工作的，以及我们如何仅通过视频来识别个人或车辆？或者如何通过水下纪录片来识别虎鲸？或者是...

使用人工智能改变3D模型定制：麻省理工学院研究人员开发了一种用户友好的界面，用于美学调整而不影响功能性

3D打印和设计领域一直存在一个持久的挑战，即能够对从在线存储库获取的开源3D设计进行定制。虽然这些平台提供了大量可以直接...

谷歌研究人员提出了一种新的人工智能方法，用于对场景动态建模的图像空间先验

即使是看似静止的图像也会因风、水流、呼吸或其他自然节奏而包含微小的振动。这是因为自然界不断在运动。人类对于运动尤为敏...

Image Description

Your AI Partner

Image Description

Exploring the future with AI

Web Analytics