Learn more about Applications - Section 13

“压缩检索文档能提升语言模型性能吗?这篇人工智能论文介绍了RECOMP:利用压缩和选择性增强改善检索增强的语言模型”

“`html 优化性能并同时管理计算资源是在日益强大的语言模型时代中的一个关键挑战。德克萨斯大学奥斯汀分校和华盛顿大学...

变形金刚如何处理较长的输入?卡内基梅隆大学和谷歌研究员揭示了一种新的方法(FIRE):相对位置编码的功能插值

基于Transformer的语言模型近年来提升了自然语言处理(NLP)领域。它们能够理解和生成类似人类的文本,为多个NLP任务带来了突...

大规模语言模型真的可以表演和推理吗?来自伊利诺伊大学厄巴纳-香槟分校的研究人员推出了LATS以提升决策能力

LLM(Language model)已经证明在推理和决策任务中具有重要价值。它们擅长将复杂的问题分解为顺序步骤,但通过自一致性和多步...

我们如何有效地压缩具有一位权重的大型语言模型?这项人工智能研究提出了PB-LLM:探索部分二进制化LLM的潜力

在大型语言模型(LLM)中,部分二值化LLM(PB-LLM)是一种先进的技术,可在不损害语言推理能力的情况下实现极低比特量化。PB-...

普林斯顿大学和Meta AI的研究人员介绍了MemWalker:一种首先将长文本处理成摘要节点树的新方法

采用了自注意力机制和模型规模和预训练数据的增加导致了大型语言模型(LLM)取得了显著进展。随着LLM的容量逐渐改善,用户更...

我们能把文本转化为科学矢量图吗?这篇人工智能论文介绍了AutomaTikZ并解释了TikZ的力量

最近,文本到图像生成的发展使得从简单的自然语言描述中创建详细的图形成为可能。使用稳定扩散(Stable Diffusion)和DALL-E...

探索先进的多模态生成人工智能

介绍 在当今不断发展的科技世界中,有一个令人兴奋的新发展即将来临——先进的多模态生成人工智能。这项尖端技术旨在使计算机更...

一个新的AI研究通过计算机视觉揭示了锂离子电池的秘密

数十亿微小的粒子密集堆积在可充电锂离子电池电极中,起着存储和供应能量的关键作用。通过X射线电影对这个过程进行可视化提供...

《人工智能时代:新的开始》

介紹 在快速發展的技術世界中,我們發現自己正處於一個新時代的關口,這個時代機器似乎擁有一種曾經僅為人類所保留的智慧。這...

来自谷歌和约翰霍普金斯大学的研究人员揭示了一种更快、更高效的文本到图片生成方法:克服扩散模型的局限性

通过产生高质量和多样化的结果,基于大规模数据训练的文本到图像扩散模型在生成任务中占据了重要地位。在最近发展的趋势中,...

遇见密斯特拉尔·特里斯迈吉斯托7B:一份关于秘传、属灵、玄学和智慧传统的指令数据集…

Mistral Trismegistus-7B是由Google AI开发的巨大语言模型,训练了包含大量神秘、秘传和灵性材料的文学和代码庞大数据集。作...

用深度学习揭开基因调控:一种理解可变剪接的新人工智能方法

备用剪接是基因调控的基本过程,允许单个基因产生多个mRNA变体和各种蛋白质异构体。这个机制对于产生细胞多样性和调控生物过...

斯坦福大学研究人员提出了MLAgentBench:一套用于对比AI研究智能体的机器学习任务集合

人类科学家可以探索未知的深处,做出各种不确定选择的发现。凭借他们手边的科学知识库,人类研究人员可以探索未知领域,并在...

“迎接Mistral-7B-v0.1:一个新晋的大型语言模型”

Mistral-7B-v0.1是人工智能(AI)中大规模语言模型(LLM)的最新发展之一。Mistral AI的最新LLM是这种模型类型中最大、最强大...

这篇来自NVIDIA的AI论文探讨了检索增强与语言模型中的长文本之力:哪个是至高无上的?它们能共存吗?

“` 在一项对比研究中,Nvidia的研究人员调查了检索增强和上下文窗口大小对大型语言模型(LLM)在下游任务中性能的影响...

我们如何在流式应用中高效部署大型语言模型?这篇人工智能论文介绍了适用于无限序列长度的StreamingLLM框架

“`html 大型语言模型(LLMs)越来越多地被用于驱动自然语言处理应用,包括代码补全,问题回答,文档摘要和对话系统。预...

遇见 Waymo 的 MotionLM:这种先进的多智能体运动预测方法可以让大型语言模型(LLM)帮助驾驶汽车成为可能

自回归语言模型在没有预定义的语法或解析概念的情况下,已经在预测句子中的下一个子词方面取得了出色的成果。这种方法已经扩...

通过CPR-Coach革新CPR培训:利用人工智能进行错误识别和评估

心肺复苏(CPR)是一种旨在挽救心跳停止或呼吸停止的个体生命的医疗急救措施。该措施的目的是保持氧气血液流向重要器官,尤其...

UC Berkeley和UCSF研究人员革命性改变神经视频生成:引入LLM-Grounded视频扩散(LVD)以改善时空动态

为了应对从文本提示生成视频的挑战,一组研究人员提出了一种新的方法,称为基于LLM的视频扩散(LVD)。核心问题在于现有模型...

在一份新的AI论文中,卡内基梅隆大学和谷歌研究员重新定义了语言模型的输出:如何通过使用暂停标记来延迟回答,从而提升问答和推理任务的性能

通过基于变压器的因果语言模型,快速生成令牌。该模型接收K个前置令牌,然后在每个隐藏层中迭代计算K个中间向量,以生成第(K ...