Learn more about Staff - Section 12

谷歌和乔治亚理工学院的研究人员介绍了DiffSeg：一种用于创建分割掩模的简单后处理人工智能方法

计算机视觉任务中的语义分割的目标是为图像中的每个像素分配一个类别或对象。预期的是得到一个密集的像素级分割图，其中每个...

普林斯顿大学的研究人员推出了MeZO：一种内存高效的零阶优化器，可以对大型语言模型（LLMs）进行微调

大型语言模型在过去几个月中以生成式人工智能的巨大成功快速发展。这些模型为一些令人瞩目的经济和社会转型做出了贡献，其中...

遇见SelFee：一种由自反馈生成驱动的迭代自我修订LLM

最近的一项研究强调了自然语言反馈在提高语言模型性能方面的有效性。韩国科学技术院的研究人员引入了一种新的SelFee模型，专...

来自UCL和Google的研究人员提出了AudioSlots 一种以插槽为中心的音频域盲源分离生成模型

最近，神经网络在处理结构化数据并从非结构化输入映射到结构化输出空间的架构中得到了广泛关注。尤其在视觉领域中，对象识别...

‘岩石与人工智能的碰撞：矿物学与零样本计算机视觉的交叉点’

矿物是一种天然的、无机的物质，具有明确的化学组成和晶体结构。它们是岩石的构成要素，对各种地质和工业过程起着至关重要的...

50+个全新尖端人工智能AI工具（2023年9月）

AI工具的发展迅速，每天都有新的工具问世。以下是一些可以提升您日常工作效率的AI工具。 AdCreative.ai 通过AdCreative.ai，...

谷歌DeepMind研究人员揭示了人工智能多样性在应对国际象棋挑战中的力量引入AZ_db，计算问题解决的下一个飞跃

人工智能已经延伸到几乎所有领域，我们发现它在几乎所有生活领域都有应用。在一些计算任务中，AI系统甚至超越了人类，在技术...

ElevenLabs发布了Eleven Multilingual v2：支持30种语言的AI语音模型

最近，ElevenLabs发布了一款名为Eleven Multilingual v2的多语言语音生成模型，可以在近30种语言中生成“情感丰富”的AI音频。...

颠覆性的电子邮件效率：SaneBox的人工智能如何改变您的收件箱体验

似乎每当有人谈论生产力时，他们都会描绘一幅黯淡的画面。“在今天这个数字时代，没有人能做任何事情…”或者“在完成任务方面，...

华盛顿大学和AI2研究人员引入了TIFA：一种通过VQA测量AI生成图像忠实度的自动评估指标

文本到图像生成模型是人工智能领域发展的最好例子之一。通过研究人员不断的进展和努力，这些模型已经走了很长的路。尽管文本...

15+ AI工具供开发者使用（2023年9月）

GitHub Copilot GitHub Copilot是一款领先市场的AI驱动编码助手。它旨在使开发人员以更高效的方式生成优质的代码，Copilot基...

GPT模型的可信度深度分析

最近的一项全球民意调查中，超过一半的受访者表示，尽管存在幻觉、虚假信息和偏见等问题，他们仍将利用这种新兴技术进行敏感...

ETH Zurich 的研究人员推出了GoT（思维图）：一种机器学习框架，能够提升大型语言模型（LLMs）的提示能力

人工智能（AI）在使用大型语言模型（LLMs）方面有所增加。最近，基于Transformer架构的仅解码器设计的一种特殊类型的LLM已经...

麻省理工学院的研究人员开发出一种人工智能技术，使机器人能够利用整只手来制定复杂的操纵物体的计划

全身操纵是人类的优势，但是机器人的弱点。机器人将盒子和搬运者的手指、手臂或躯干之间的每个可能的接触点解释为独立的接触...

DeepMind研究人员介绍了Reinforced Self-Training（ReST）：一种简单的算法，通过Growing Batch Reinforcement Learning（RL）受到人类偏好的启发，用于将LLMs与人类偏好对齐

大型语言模型（LLMs）非常善于产生写作流畅的内容并解决各种语言问题。这些模型通过使用大量的文本和计算进行训练，以增加下...

“认识AutoGPTQ：基于GPTQ算法的易于使用的LLMs量化包，提供用户友好的API”

来自Hugging Face的研究人员提出了一种创新解决方案，以应对训练和部署大型语言模型（LLMs）所需的资源密集型需求。他们在Tra...

数据合约在数据管道中的作用

什么是数据契约？数据契约是定义系统内数据应如何结构化和处理的协议或一组规则。它作为组织内部不同部分或不同软件组件之间...

MIT的这项AI研究展示了基于光的机器学习系统如何能产生更强大和高效的大型语言模型

深度神经网络（DNN）就像计算机的超级大脑。它们擅长从大量信息中找出棘手的东西。它们使计算机足够聪明，能够理解图片，像人...

腾讯AI实验室的研究人员推出了IP-Adapter：一种用于文本到图像扩散模型的文本兼容图像提示适配器

“苹果”，瞬间你的脑海中浮现出一个苹果的图像。我们的大脑如此迷人，同样令人着迷的是，生成式人工智能带来了同样的创造力和...

Meta AI发布了SeamlessM4T：一个基础的多语言和多任务模型，可以在语音和文本之间无缝地进行翻译和转录

在一个越来越全球化的互动世界中，掌握多种语言可以弥合鸿沟，促进理解，并为各种机遇打开大门。学习多种语言可以帮助我们深...

Image Description

Your AI Partner

Image Description

Exploring the future with AI

Web Analytics