Learn more about language model - Section 13

认识 Med-PaLM 多模态（Med-PaLM M）：一个大型多模态生成模型，可以灵活地编码和解释生物医学数据

大型语言模型（LLMs）在几乎所有领域都取得了进展，从医疗保健和金融到教育和社交媒体。医疗行业的临床医生依赖各种各样的数...

ETH Zurich研究人员推出LMQL：一种用于语言模型交互的编程语言

大语言模型在包括问答和代码生成在内的各种任务上的性能令人印象深刻。语言模型可以根据输入自动生成一个统计上合理的序列结...

挑战者旨在取代OpenAI的LLM霸主地位：XLSTM

人工智能正目睹一场对决，约瑟夫·“塞普”·霍赫赖特教授揭示了语言模型领域的一位新挑战者。LSTM，由塞普·霍赫赖特博士和尤尔根...

微软AI团队发布了NaturalSpeech 2：一种基于潜在扩散模型的尖端TTS系统，具备强大的零样本语音合成和增强的表达式韵律

文本到语音（TTS）的目标是生成高质量、多样化的语音，听起来像真实的人说的。韵律、说话人身份（如性别、口音和音色）、说话...

“先有梦想，后学习：DECKARD是一种利用LLMs训练强化学习（RL）智能体的AI方法”

强化学习（RL）是训练可以通过与环境交互学习完成复杂任务的自主代理的流行方法。RL使它们能够在不同条件下学习最佳动作，并...

斯坦福大学研究人员推出了Sophia：一种可扩展的语言模型预训练的二阶优化器

鉴于训练语言模型的高昂成本，对优化过程进行非平凡改进将极大地减少完成训练过程所需的时间和金钱。Adam及其变种长时间以来...

一项新的人工智能研究解释了如何通过上下文指导学习（ICIL）来提高预训练和指导微调模型的零样本任务泛化性能

大型语言模型（LLMs）通过一种称为few-shot演示的过程，在推理过程中展示出了它们可以适应目标任务的能力，有时也被称为上下...

大型语言模型（LLM）（如ChatGPT）为何在微调时使用强化学习而不是监督学习的5个原因

随着生成式人工智能在过去几个月取得的巨大成功，大型语言模型不断进步和改进。这些模型正在为一些值得注意的经济和社会转型...

斯坦福大学的研究人员介绍了局部条件扩散：一种使用扩散模型进行组合式文本到图像生成的方法

3D场景建模传统上是一项耗时的过程，只有具有领域专业知识的人才能进行。尽管在公共领域中有大量的3D材料可用，但很难找到与...

ChatGPT的行为随时间变化吗？研究人员评估了GPT-3.5和GPT-4的2023年3月版和2023年6月版在四个不同任务上的表现

大型语言模型（LLMs）已成功证明是人工智能领域中最好的创新。从BERT、PaLM和GPT到LLaMa DALL-E，这些模型在理解和生成语言以...

韩国科学技术院（KAIST）的一项新的人工智能研究介绍了FLASK：基于技能集的语言模型细粒度评估框架

令人难以置信的是，LLMs已经证明能够与人类价值观相匹配，提供有益、诚实和无害的回应。特别是，通过在各种任务或用户偏好上...

稳定AI团队推出FreeWilly1和FreeWilly2：全新的开放获取大型语言模型（LLMs）

FreeWilly1及其继任者FreeWilly2是由Stability AI的CarperAI团队开发的功能强大的新开源大型语言模型（LLM）。这两个模型在使...

“LLM能够在您的iPhone上运行吗？认识MLC-LLM：这是一个开放框架，可以直接将语言模型（LLMs）带入一类带有GPU加速的平台”

大型语言模型（LLM）是人工智能领域当前的热门话题。在医疗保健、金融、教育、娱乐等广泛行业中已经取得了相当程度的进展。著...

这篇AI论文提出了一种名为Cones的新型基于梯度的方法，用于分析和识别扩散模型中的概念神经元

大脑的复杂结构使其能够执行令人惊叹的认知和创造性任务。根据研究，人类内侧颞叶的概念神经元对给定刺激的语义特征有不同的...

一项新的人工智能研究引入了多任务提示调整（MPT）来进行迁移学习

预训练语言模型（PLMs）通过微调在许多下游NLP任务上取得了显著的改进。虽然当前的PLMs可能包含数亿个参数，但传统的完全任务...

遇见Prismer：一个由专家组成的开源视觉语言模型的集合

最近有几种最新的视觉语言模型展示出了非凡的多模态生成能力。但通常情况下，这些模型需要在庞大的数据集上训练庞大的模型。...

OpenAI推出ChatGPT的自定义指令，实现个性化的人工智能交互

OpenAI通过引入名为“自定义指令”的新功能，为其AI语言模型ChatGPT增强了用户控制能力。这个最新的更新旨在简化互动并为用户提...

我们知道LLMs可以使用工具，但你知道它们也可以制造新的工具吗？来认识一下LLMs作为工具制造者（LATM）：一个闭环系统，允许LLMs制造自己的可重复使用工具

大型语言模型（LLMs）在广泛的自然语言处理任务中表现出色，并显示出实现某些人工智能普适特征的鼓舞人心证据。最近的研究还...

这篇AI论文提出了保留网络（RetNet）作为大型语言模型的基础架构：实现训练并行性、低成本推理和良好的性能

Transformer（变压器）最初是为了解决循环模型中的顺序训练问题而开发的，后来被公认为大型语言模型的事实标准架构。变压器的...

意大利的一项新的人工智能研究介绍了一种基于扩散的生成模型，能够同时进行音乐合成和音源分离

人类有能力同时处理多个声音源，无论是在音乐作曲或合成与分析，即源分离方面。换句话说，人脑可以从混合物中分离出单个声音...

Image Description

Your AI Partner

Image Description

Exploring the future with AI

Web Analytics