Learn more about Editors Pick - Section 6
重新定义变形金刚:如何使用简单的前馈神经网络模拟注意机制以进行高效的序列到序列任务
来自苏黎世联邦理工学院的研究人员分析了利用标准浅层前馈网络来模拟变形器模型的注意机制的有效性,变形器模型是一种用于序...
加州大学圣地亚哥分校的研究人员推出了EUGENe:一种易于使用的深度学习基因组学软件
深度学习在生活的各个领域中被使用。它在各个领域都有其实用性。它对生物医学研究产生了重大影响。它就像一个智能计算机,可...
如何高效培训您的LLM?小规模实施的最佳实践
在关于大型语言模型(LLM)的最新进展的日常新闻洪流中,您可能会问:“我该如何训练我自己的模型?”如今,针对您特定需求的LL...
认识 PhysGaussian:一种将物理基础的牛顿动力学与三维高斯函数相融合,产生高质量新型动作合成的人工智能技术
最近,神经辐射场(NeRFs)的进展展示了3D图形和感知方面的进步。此外,最先进的3D高斯喷溅(GS)框架进一步增强了这些改进。...
“Inflection 推出 Inflection-2:全球最佳的 AI 模型,针对其计算类别和当今世界上第二最具能力的 LLM”
Inflection AI开发了一种具有最佳效果的大型语言模型。该公司表示,它的模型Inflection-2在全球排名第二,仅次于OpenAI的最新...
加州大学伯克利分校研究人员提出CRATE:一种用于深度学习中高效数据压缩和稀疏化的新型白盒变换器
近年来,深度学习在处理和建模大量高维和多模态数据方面的实际成功取得了指数级的增长。在这一成就中,深度网络发现数据中可...
斯坦福研究人员推出了BLASTNet:第一个用于基础流体动力学的大型机器学习数据集
斯坦福研究人员推出了一项被称为BLASTNet的突破性技术,开启了计算流体动力学(CFD)新时代。然而,这只是一个概念验证,并不...
请查看这个名为“游戏之子(SoG)”的新人工智能系统,它能够在各种游戏中击败人类,并学会玩新游戏
利用游戏作为人工智能绩效指标的传统已有很长历史。在各种完全信息游戏中,搜索和基于学习的方法表现良好,而基于博弈论的方...
中国的这项AI研究探索了人工智能的错觉心智:深入剖析大型语言模型中的幻觉
近年来,大型语言模型在自然语言处理领域引起了一场范式变革,带来了以往未曾有的语言创建、理解和推理的进步。然而,与LLM的...
这项AI研究提出了随机切片混合数据增强(RSMDA)来提高图像分类的新方法:一种增强神经网络准确性和鲁棒性的创新方法
数据增强是深度学习中的关键技术,它通过修改现有样本来创建新的训练数据。数据增强非常重要,因为它使训练数据多样化,提高...
这篇AI论文介绍了一种开创性的机器学习模型,用于高效预测氢燃烧:利用负设计和反应化学中的元动力学
势能表面(PES)代表原子或分子位置与与其相关的势能之间的关系。PES在理解分子行为、化学反应和材料性质方面至关重要。它们...
来自微软研究院和清华大学的研究人员提出了“思维骨架(SoT):一种新的人工智能方法,加速LLMs的生成”
<img alt=”” src=”https://ai.miximages.com/www.marktechpost.com/wp-content/uploads/2023/11/Screen...
这项人工智能研究提出了可驾驶的三维高斯头像(D3GA):首个使用高斯喷点渲染人体的可控三维模型
印象派艺术运动是由19世纪的无名画家、雕塑家、版画家等创立的,其特点是“短小、断续的笔触,几乎无法传达形式”。最近的研究...
NVIDIA AI研究人员提出了Tied-Lora:一种新的人工智能方法,旨在提高低秩适应(LoRA)方法的参数效率
Nvidia的一组研究人员开发了一种名为Tied-LoRA的新技术,旨在提高低秩自适应(LoRA)方法的参数效率。该方法采用权重绑定和选...
这家总部设在芬兰的人工智能创业公司发布了Poro:一款革命性的开源语言模型,提升了欧洲多语言人工智能能力
“`html 对于在人工智能领域中拥有比英语更少数据的欧洲语言来说,创建大型语言模型是具有挑战性的。科技界的公司一直在...
真正的AI赢得项目,建立欧洲开源大型语言模型
在2023年11月23日的贝尔格莱德数据科学大会上宣布,Real AI赢得了ISCRA项目。Real AI被选中构建欧洲首个基于世界第四大人工智...
这篇AI论文通过黎曼几何深入理解扩散模型的潜变空间
随着人工智能和机器学习的日益普及,其主要子领域,如自然语言处理、自然语言生成等,正以快速的步伐发展。最近引入的扩散模...
微软研究院推出Florence-2:一种新颖的视觉基础模型,采用统一的基于提示的表征方法,可用于多种计算机视觉和视觉语言任务
在人工通用智能(AGI)系统中,使用预先训练的、适应能力强的表示已经成为一种明显的趋势,这为各种应用提供了与任务无关的优...
阿里巴巴研究员推出Qwen音频系列:一套具备通用音频理解能力的大型音频语言模型集合
阿里巴巴集团的研究人员推出了Qwen-Audio,它解决了对于多样化任务而言预训练音频模型的限制性挑战。设计了一种基于标签的多...
麻省理工学院的研究人员开发了一种机器学习技术,使深度学习模型能够在边缘设备上直接高效适应新的传感器数据
随着技术的迅猛发展,边缘设备已成为我们日常生活中不可或缺的一部分,完美地融入了我们网络化的社会。这些广泛使用的边缘设...
- You may be interested
- 使用Python和Sklearn创建动画来展示4种基...
- J&K政府准备利用人工智能改革医疗保健
- 2024年掌握SQL概念的十本书
- 刑事律师警告称,人工智能可能会让法庭“怀...
- 白宫签署行政命令以解决人工智能安全问题
- 微软人工智能推出鲸鱼(Orca):一个拥有1...
- “人工智能如何改变IT服务管理”
- “迁移学习的不合理有效性”
- 在边缘人工智能应用中最大化性能
- 这篇AI论文介绍了GraphGPT框架:利用大型...
- 10个最佳ChatGPT提示,适用于人力资源专业...
- 最佳5门自动驾驶课程(2023年)
- 一个简单(但有效)的方法来实现dbt模型的...
- 亚马逊购物如何使用亚马逊Rekognition内容...
- 加州大学圣地亚哥分校计算机科学家解决每...