Learn more about Editors Pick
解密关注机制:转变模型中的最大边际解决方案
注意机制在自然语言处理和大型语言模型中发挥了重要作用。注意机制允许转换解码器集中关注输入序列中最相关的部分。它通过计...
字节跳动AI研究介绍了StemGen:一种端到端音乐生成深度学习模型,它经过训练可以聆听音乐背景并作出适当的回应
使用深度学习进行音乐生成是指训练模型以创建音乐作品,模仿现有音乐中的模式和结构。常用的深度学习技术包括循环神经网络(R...
麻省理工学院的研究人员通过先进的神经网络模型揭示了大脑和听觉之间的新深入认识
在一项引人注目的研究中,麻省理工学院的研究人员深入探索了深度神经网络的领域,旨在揭示人类听觉系统的奥秘。这种探索不仅...
斯坦福大学研究人员引入了一种统一的人工智能框架,用于大型语言模型(LLMs)中的协作和贡献属性
大型语言模型(LLMs)是人工智能(AI)领域中指数级发展的最新进展。尽管这些模型在文本生成、问题回答、文本摘要等任务中表...
我们如何在人工智能中推进物体识别?这篇人工智能论文介绍了GLEE:一个用于增强图像和视频分析的通用物体级基础模型
图像和视频中的目标感知释放了机器解读视觉世界的力量。就像虚拟侦探一样,计算机视觉系统搜索像素,识别、追踪和理解涂绘数...
EPFL 和苹果研究人员开源 4M :一种用于训练跨数十种模态和任务的多模式基础模型的人工智能框架
训练能够在没有多样化任务特定调整的情况下有效处理各种任务的大型语言模型 (LLMs) 在自然语言处理 (NLP) 领域越来越流行。尽...
遇见VonGoom:大型语言模型中数据毒化的新颖AI方法
数据污染攻击通过向训练数据集中注入虚假数据来操纵机器学习模型。当模型面对真实世界的数据时,可能导致不正确的预测或决策...
Upstage揭示了Solar-10.7B:在单回合对话中具有深度放大和精细调整精度的领先大型语言模型
韩国AI公司Upstage的研究人员已经成功应对了在最大化语言模型性能的同时最小化参数的挑战。在大型语言模型(LLMs)中,模型大...
Kinara发布Ara-2处理器:为增强性能的设备上人工智能处理带来革命
Kinara是能效卓越的边缘人工智能的先驱,引入了颠覆性的Ara-2处理器,据称与其前身相比,其在设备上提供了令人瞩目的八倍性能...
谷歌AI推出MedLM一系列针对医疗行业使用案例进行细化调整的基于基础模型的家族模型
谷歌研究人员推出了专为医疗保健行业细调的模型基础,MedLM,目前在美国可用。这是谷歌在医疗保健和医学领域的早期研究的基础...
比较离群值检测方法
异常检测是一种无监督的机器学习任务,用于识别给定数据集中的异常(不寻常的观察)在许多现实世界的情况下,这个任务非常有...
如何使用Langchain?逐步指南
LangChain是一个人工智能框架,旨在帮助程序员使用大型语言模型开发应用程序。让我们深入了解如何使用LangChain? 第一步: 设...
这篇 AI 论文揭示了 X-Raydar:开创性的开源深度神经网络用于胸部 X 射线异常检测
来自英国各大学的研究人员开发了一种开源人工智能(AI)系统X-Raydar,用于全面检测胸部X射线异常。该系统在来自英国六家医院...
斯坦福大学的研究人员发布了名为PLATO的新型人工智能方法,用于解决高维度、低样本机器学习中的过拟合问题,采用知识图增强正则化技术
“`html 知识图谱(KG)是一种以节点和边作为信息存储的基于图的数据库。另一方面,多层感知机(MLP)是一种用于机器学...
这篇人工智能论文介绍了RTMO技术:利用双1-D热图在实时多人姿势估计中取得的突破
姿势估计领域是一个快速发展的领域,涉及确定物体在空间中的位置和方向,研究人员不断开发新的方法提高其准确性和性能。清华...
这篇AI论文揭示了亚马逊关于大型语言模型中错误代码的最新机器学习见解
“` 编程可以很复杂,有时很难避免写出错误的代码。为了帮助代码补全,已经开发了大型代码语言模型(Code-LLMs),但有...
这篇AI论文探讨了大型语言模型中的行为错位:GPT-4在模拟股票交易中的欺骗策略
关于一些复杂的AI系统可能参与战略欺骗的问题已经引起了关注。致力于评估AI系统安全性的Apollo Research研究人员最近对此问题...
这篇AI文献介绍了EdgeSAM:推进边缘设备上高速高效的图像分割机器学习
Segment Anything Model(SAM)是一种基于人工智能的模型,用于图像的对象检测和识别的分割。它是各种计算机视觉任务的有效解...
LangChain是什么?用途和好处
LangChain是一个人工智能框架,旨在帮助程序员使用大型语言模型开发应用程序。它允许您创建具有以下两个关键特性的应用程序:...
斯坦福大学和 Salesforce AI 的研究人员发布了UniControl:一种用于AI图像生成中高级控制的统一扩散模型
生成性基础模型是一类人工智能模型,旨在生成与其训练数据相似的新数据。这些模型常被应用于自然语言处理、计算机视觉、音乐...
- You may be interested
- 手被卡在饼干罐里:GPT4如何把假新闻卖给了我
- 智能绿化:使应用程序更可持续的七个策略
- 用护栏保护LLM
- Oracle云基础设施提供新的NVIDIA GPU加速...
- 揭示隐藏的模式:层次聚类简介
- 谷歌AI研究推出颠覆性的量子算法,高效模...
- 微软与OpenAI合作的内幕故事 (Wēiruǎn yǔ ...
- GPT-4 代码解释器:即时生成 Python 数据...
- Vianai的新开源解决方案解决了人工智能的...
- 闯入全宇宙:OpenUSD对Autodesk Maya的增...
- 驾驭变革之风:2024年关键技术趋势
- Google研究在I/O 2023上的展示
- 深入探究统计期望的科学
- 52 AI工具供销售专业人员使用(2023)
- Hugging Face上的推理解决方案概述