Learn more about Editors Pick - Section 14
在一份新的AI论文中,卡内基梅隆大学和谷歌研究员重新定义了语言模型的输出:如何通过使用暂停标记来延迟回答,从而提升问答和推理任务的性能
通过基于变压器的因果语言模型,快速生成令牌。该模型接收K个前置令牌,然后在每个隐藏层中迭代计算K个中间向量,以生成第(K ...
西北大学的研究人员开发出了首个人工智能系统,可以智能设计机器人
在一项突破性成果中,由西北大学领导的研究团队揭示了一种能够自主制作和设计机器人的人工智能(AI)系统。这一技术奇迹代表...
我们能真正相信人工智能AI数字水印技术吗?这篇AI论文揭示了当前深度伪造方法防御中的弱点
生成人工智能领域的快速发展使数字内容创作的格局发生了重大变化。这些AI算法已经进步并变得更广泛可用,可以创建非常引人入...
遇见SynthIA(合成智能代理)7B-v1.3:经过鲸鱼风格数据集训练的Mistral-7B-v0.1模型
SynthIA-7B-v1.3是一种七百亿参数的大型语言模型(LLM)。它实际上是通过Orca风格数据集训练的Mistral-7B-v0.1模型,现在能够...
Google DeepMind介绍了直接奖励微调(DRaFT):一种用于微调扩散模型以最大化可微奖励函数的有效人工智能方法
扩散模型已经在各种数据类型的生成建模中引起了革命。然而,在从文本描述中生成美观的图像等实际应用中,通常需要进行微调。...
“打破3D实例分割的边界:改进伪标记和逼真场景的开放世界方法”
通过提供物体实例级别的分类和语义标注,3D语义实例分割试图识别由点云或网格表示的给定3D场景中的物体。包括机器人、增强现...
这篇AI论文揭示了一种理解深度学习模型的新方法:通过概念相关性传播(CRP)来解开“何处”和“何物”
机器学习和人工智能领域变得非常重要。我们每天都在取得新的进展。该领域正在影响各个领域。通过利用精心开发的神经网络结构...
如何提升大型语言模型的质量?认识PIT:一种隐式自我改善框架
基于大的语言模型(Large Language Models,简称LLMs)在数学推理、摘要、对话、架构归纳和领域特定问题解决等各种复杂任务中...
迷力AI将Mistral 7B开源:一个小巧而强大的语言模型,适用于多种用例
语言模型(LLMs)是一类能够生成和理解文本的人工智能系统。这些模型经过在包含文本和代码的庞大数据集上的训练,并在各种任...
关于Qwen大型语言模型(LLM)系列的一切你需要知道的
大型语言模型(LLMs)自问世以来,已经极大地重塑了人工智能(AI)领域的格局。这些模型为挑战性的推理和问题解决问题提供了强大...
清华大学和微软研究员推出ToRA:一种用于数学问题求解的集成人工智能工具的推理代理
人工智能和数学问题解决取得了重大进展,尤其是大型语言模型的出现。然而,这些模型仍然面临复杂的数学挑战。微软和清华大学...
中国的研究人员公布了ImageReward:一种突破性的人工智能方法,利用人类偏好反馈优化文本到图像模型
“` 近年来,文本到图像生成模型取得了巨大的发展,包括自回归和扩散方法。这些模型在给定正确的语言描述(即提示)时,...
MIT和哈佛的研究人员推出了一种革命性的基于人工智能的计算方法:以更少的实验高效地准确定位最佳的基因干预方案
在细胞重编程领域,研究人员面临识别最佳遗传扰动,将细胞工程化为新状态的挑战,这是一种在免疫疗法和再生疗法等应用中非常...
Meta AI推出AnyMAL:未来多模态语言模型的先驱,桥接文本、图像、视频、音频和动作传感器数据
在人工智能领域,使机器能够理解和生成人类语言,并结合各种感官输入,如图像、视频、音频和运动信号,一直是一个基本的难题...
日本柴田学院的研究人员以深度学习革新脸部方向检测技术:突破隐藏面部特征和拓展视野角度的挑战
在计算机视觉和人机交互领域中,面部定向估计这一关键任务已成为具有多方面应用的重要组成部分。这项技术在提升道路安全方面...
MIT研究人员推出PFGM ++:物理和人工智能的突破性融合,实现先进模式生成
在过去几年中,生成建模领域取得了显著的进展,研究人员努力创造能够生成高质量图像的模型。然而,这些模型在图像质量和稳健...
这篇AI论文介绍了COVE方法:一种通过自我验证来解决语言模型幻觉的新型AI方法
使用包含数十亿个文本令牌的大型文本文档语料库来训练大型语言模型(LLM)。已经证明,随着模型参数数量的增加,性能在像关闭书...
线性代数1:线性方程和方程组
这是成为一个线性代数基础系列的首次添加,它是机器学习背后的基础数学如果读者在……阅读本文将对他们起到最好的帮助
揭示多模态神经元的秘密:从Molyneux到Transformers的旅程
“`html Transformer可能是人工智能领域最重要的创新之一。这些神经网络架构于2017年引入,彻底改变了机器理解和生成人...
模特合并是什么意思?
模型合并是将多个不同模型(每个模型设计用于执行不同任务或解决不同问题)合并为一个统一的模型的过程,而无需进行额外的训...
- You may be interested
- 构建一条端到端的边缘视觉质量检验的MLOps...
- 使用数据和人工智能追踪实现联合国全球目...
- NVIDIA与NTT DOCOMO合作推出全球首个GPU加...
- 与人工智能需求相关的数据中心成本上升
- 认识HITL-TAMP:利用自动化规划和人工控制...
- 用Matplotlib自定义颜色映射
- 生成式人工智能中的LLM代理解码机会和挑战
- 继承风的意思是跟着风的方向去
- 在Amazon SageMaker Studio中使用Amazon S...
- 这项AI研究介绍了两种高质量视频生成的扩...
- 如何使用Python与Google的PaLM 2 API
- 如何使用Megatron-LM训练语言模型
- 剑桥的研究人员开发了一种使用机器学习的...
- 全面指南:排名评估指标
- 深度学习系统从外部探索材料内部