Learn more about Tech News - Section 4

“遇见 AudioSR：一个即插即用、一体化的人工智能解决方案，可将音频升频至令人难以置信的48kHz质量”

数字音频处理领域的一个关键挑战是音频超分辨率。它旨在通过预测和合并低分辨率音频数据中缺失的高频成分来提高音频信号的质...

LLMs与知识图谱

什么是LLMs？大型语言模型（LLMs）是能够理解和生成人类语言的人工智能工具。它们是具有数十亿参数的强大神经网络，经过大量...

《百川2：一系列包含70亿和130亿参数的大规模多语言语言模型，从头开始训练，使用了26万亿个令牌》

大型语言模型在近年来取得了显著而令人鼓舞的发展。语言模型现在具有数十亿甚至数万亿个参数，例如GPT3、PaLM和Switch Transf...

来自埃因霍温和西北大学的研究人员开发了一种新的神经形态生物传感器，能够进行芯片内学习，无需外部训练

神经形态计算受到人脑结构和功能的启发。神经形态芯片是一种利用物理人工神经元进行计算的设备。与传统的数字处理器不同，这...

“放大看不见的：这种人工智能AI方法使用NeRFs来可视化3D中的微妙动作”

我们生活在一个充满运动的世界，从我们身体的微小运动到地球的大规模运动。然而，其中许多运动对于肉眼来说太小而无法看到。...

富士通和Linux基金会推出富士通自动机器学习和人工智能公平技术：开创透明、道德和可访问性的先河

在人工智能（AI）技术快速发展的时代，透明度、伦理和可访问性问题已经成为主要关注的焦点。虽然AI解决方案无疑推动了该领域...

谷歌研究介绍了MediaPipe FaceStylizer：一种高效的少样本人脸风格化设计

近年来，研究人员和消费者对结合增强现实（AR）的智能手机应用程序表现出越来越大的热情。这使得用户可以实时生成和修改短视...

“相遇InstaFlow：一种新颖的一步生成AI模型，源自开源的稳定扩散（SD）”

扩散模型在文本到图像生成方面引起了一场革命，提供了卓越的质量和创造力。然而，值得注意的是，它们的多步采样过程因其缓慢...

这篇来自韩国的人工智能研究介绍了MagiCapture：一种将主题和风格概念进行个性化整合以生成高分辨率肖像图像的方法

人们经常需要去摄影棚，然后经过昂贵而耗时的图片编辑过程，才能制作出适合简历或婚庆的高质量肖像照片。想象一种情况，你只...

大型语言模型能够自我评估安全性吗？认识RAIN：一种新颖的推理方法，无需微调即可转化人工智能对齐和防御

预训练的大型语言模型（LLMs），如GPT-3，已被证明在理解和回答人类问题、帮助编码工作等方面具有非凡的能力。然而，它们经常...

中国的研究人员介绍了ImageBind-LLM：一种通过ImageBind对大型语言模型（LLM）进行多模态指导调整的方法

研究人员最近在大型语言模型（LLMs）的指令调整方面取得了显著进展。ChatGPT和GPT-4是遵循语言和视觉中人类命令的通用对话系...

这篇AI论文介绍了Agents：一个用于自主语言代理的开源Python框架

在客户服务、咨询、编程、写作、教学等任务中，语言代理可以减少人力投入，是实现人工通用智能（AGI）的潜在第一步。最近对语...

我们如何看待医疗机器学习中的有偏见的临床数据？呼吁采用考古学的视角

来自麻省理工学院、约翰霍普金斯大学和艾伦·图灵研究所的研究人员认为，在AI系统中处理有偏见的医疗数据并不像俗语“垃圾进，...

斯坦福大学的研究人员介绍了Spellburst：一种由大型语言模型（LLM）驱动的创意编码环境

在创建令人惊叹的数字艺术作品时，生成艺术家经常发现自己在编码的复杂性中苦苦挣扎。使用Processing或AI文本到图像工具等语...

变压器和支持向量机之间的联系是什么？揭示变压器架构中的隐含偏差和优化几何

自注意力使得自然语言处理（NLP）得到了革命性的改变，它是变压器设计的关键要素，使得模型能够识别输入序列中的复杂关联。自...

“遇见DiffBIR：一种使用预训练的文本到图像扩散模型解决盲目图像恢复问题的人工智能方法”

随着人工智能领域的显著进步，包括自然语言处理、自然语言理解、计算机视觉等在内的AI子领域也在快速发展。在计算机视觉和图...

麻省理工学院和微软的研究人员引入了DoLa：一种新颖的人工智能解码策略，旨在减少LLMs中的幻觉

许多自然语言处理（NLP）应用程序从使用大型语言模型（LLMs）中获益良多。虽然由于规模化而改善了LLMs的性能并增加了额外的功...

“遇见BLIVA：一种多模态大型语言模型，用于更好地处理文本丰富的视觉问题”

最近，大型语言模型（LLMs）在自然语言理解领域发挥了关键作用，展示了在广泛任务范围内泛化的非凡能力，包括零-shot和少-sho...

“人工智能如何革新有声图书制作？利用神经文本转语音技术从电子书籍中创作成千上万本高质量的有声图书”

如今，许多人选择阅读有声书而不是传统的书籍或其他媒体。有声书不仅让读者在路上也能享受信息，还能帮助让内容对各个群体更...

麻省理工学院的研究人员引入了一种新颖的轻量级多尺度关注机制，用于设备端的语义分割

语义分割是计算机视觉中的一个基本问题，其目标是为输入图像中的每个像素分类为某个类别。自动驾驶、医学图像处理、计算摄影...

Image Description

Your AI Partner

Image Description

Exploring the future with AI

Web Analytics