Learn more about language model - Section 14

微软和哥伦比亚大学的研究人员提出了LLM-AUGMENTER：一种人工智能系统，它通过一组即插即用的模块增强黑盒LLM

大型语言模型（LLMs）如GPT-3因其丰富的世界知识而被广泛认可，能够生成连贯和信息丰富的自然语言文本。然而，将这些知识编码...

斯坦福大学和DeepMind的研究人员提出了使用大型语言模型（LLMs）作为代理奖励函数的想法

随着计算和数据的发展，自主代理获得了更多的力量。在这种情况下，人们有必要对代理学习的策略进行一定程度的干预，并检查它...

斯坦福研究院推出FlashAttention-2：为长上下文语言模型带来速度和效率的飞跃

在过去的一年中，自然语言处理领域取得了显著的进展，因为出现了具有更长上下文的语言模型。其中包括具有32k上下文长度的GPT-...

Meta的战略智慧：Llama 2可能成为他们的新社交图谱

在引起科技行业关注的举动中，Meta最近宣布发布了Llama 2，这是其免费、开源的大型语言模型（LLM）的第二个版本。作为一个使...

“认识Mojo：一种新的编程语言，为AI开发人员提供了Python的易用性和C的性能，实现了AI硬件的无与伦比的可编程性和AI模型的可扩展性”

人工智能领域正在以极快的速度蓬勃发展。近年来，人工智能和机器学习逐渐演变，现在每个组织都在其产品中引入人工智能，并努...

认识MPT-7B：一个在MosaicML的指导下，通过1T个文本和代码令牌进行训练的新开源大型语言模型

MosaicML最近推出了一款划时代的工具MPT-7B，以改变企业和组织在预测分析和决策制定方面的方式。这款新工具是一个强大的机器...

“认识Lamini AI：一款革命性的LLM引擎，让开发者轻松训练ChatGPT级别的语言模型”

从零开始教授LLM是具有挑战性的，因为需要大量时间来理解为什么微调模型失败；微调小数据集的迭代周期通常以数月计算。相比之...

MLCommons介绍MedPerf：一种用于评估AI模型在临床疗效方面的开源平台

评估人工智能模型在大型多样化的实际数据集上的效果对于医疗人工智能的临床应用至关重要。MLCommons，一个开放的全球工程社区...

见证ImageReward：一种突破AI生成能力和人类价值观鸿沟的革命性文本到图像模型

在机器学习中，基于文本输入可以生成图像的生成模型近年来取得了重大进展，各种方法都显示出了有希望的结果。虽然这些模型引...

斯坦福研究人员提出了EVAPORATE：一种新的人工智能方法，将语言模型的推理成本减少了110倍

大型语言模型现在经常成为头条新闻。凭借其卓越的能力和在各个领域的应用，几乎每天都会发布一篇新的研究论文或LLM的新更新。...

谷歌AI引入了符号调整：一种简单的微调方法，通过强调输入-标签映射来提高上下文学习

语言模型在上下文中调整输入-标签对，其中自然语言标签被重新映射为任意符号。对于给定的任务，模型必须依赖上下文中的输入-...

Meta AI介绍CM3leon：创新的多模态游戏改变者，以无与伦比的计算效率提供最先进的文本到图像生成技术

自然语言处理和根据文本输入生成图像的系统最近引起了人们对生成式人工智能模型的新兴兴趣。一项最新的Meta研究揭示了CM3leon...

遇见自动推理和工具使用（ART）：一个使用冻结的大型语言模型（LLMs）的框架，可以快速生成推理程序的中间阶段

大型语言模型可以通过在上下文学习中提供一些演示和实际语言指令来迅速适应新任务。这样可以避免托管LLM或标注大型数据集，但...

多模态语言模型：人工智能（AI）的未来

大型语言模型（LLM）是能够分析和生成文本的计算机模型。它们通过对大量文本数据进行训练，以提高在文本生成和编码等任务中的...

一篇新的人工智能论文解释了大型语言模型作为一般模式机器可以具有的不同专业水平

LLMs，即大型语言模型，被教导将编织在语言结构中的许多模式纳入其中。它们在机器人学中被用作高级规划器，用于遵循指令的任...

斯坦福大学和Mila研究人员提出了Hyena：一种不需要注意力的替代方案，可以替代许多大规模语言模型的核心构建模块

众所周知，开发和推出令人惊叹的生成模型，如ChatGPT和Bard，以及它们的基础技术GPT3和GPT4的竞赛，已经以巨大的力量席卷了人...

这篇AI论文探讨了大型语言模型（LLMs）在文本标注任务中的潜力，重点关注ChatGPT

高质量的标记数据对于许多自然语言处理应用非常重要，特别是用于训练分类器或评估无监督模型的效果。例如，学者们经常希望将...

“认识 FreedomGPT：一种基于 Alpaca 构建的开源 AI 技术，经过编程以识别和优先考虑道德因素，不经过任何审查过滤”

大型语言模型在自然语言处理和自然语言理解方面的非凡能力使其迅速赢得了巨大的声誉。最近备受瞩目的模型是著名的ChatGPT。由...

“LLMs反映的是谁的观点？这篇来自斯坦福大学的人工智能论文通过公众舆论调查的视角，研究了语言模型LMs所反映的观点”

在过去的几年里，人们观察到语言模型（或称为LM）在各行各业中加速自然语言处理应用的步伐非常关键，例如医疗保健、软件开发...

通过Text2Cinemagraph探索动态图像的力量：一种从文本提示生成电影画照的新型AI工具

如果您对术语还不熟悉，您可能会想知道什么是活动照片，但我可以向您保证，您可能已经偶然遇到过它们。活动照片是视觉上引人...

Image Description

Your AI Partner

Image Description

Exploring the future with AI

Web Analytics