Learn more about language model - Section 7

这篇AI论文介绍了COVE方法:一种通过自我验证来解决语言模型幻觉的新型AI方法

使用包含数十亿个文本令牌的大型文本文档语料库来训练大型语言模型(LLM)。已经证明,随着模型参数数量的增加,性能在像关闭书...

麻省理工学院和香港中文大学的研究人员提出了LongLoRA(长期低秩适应):一种用于长上下文大语言模型(LLMs)的高效微调AI方法

大型语言模型(LLMs)的引入对人工智能领域带来了显著的进展。基于自然语言处理(NLP)、自然语言理解(NLU)和自然语言生成...

大型语言模型对话应用程序:理解用户输入、提示和回复的顺序

本文解释了用户输入如何被处理、转换为提示,发送到LLMs,并生成和呈现给用户的回应

面对 LMSYS-Chat-1M:一个包含2500万条与25个最先进的LLM进行的真实世界对话的大规模数据集

大型语言模型(LLMs)已经成为各种人工智能应用的重要组成部分,从虚拟助手到代码生成。当与LLMs互动时,用户会根据不同的目...

清华大学研究人员推出OpenChat:一种新型的人工智能AI框架,通过混合质量数据增强开源语言模型

在快速发展的自然语言处理领域中,大型语言模型的能力已经成倍增长。全球的研究人员和机构不断推动这些模型的界限,以改善它...

这篇来自微软的AI论文介绍了一种新的训练语言模型的方法:模仿人类阅读理解,提高生物医学、金融和法律领域的性能表现

由于普通大型语言模型(LLM)过度饱和,领域特定的大型语言模型应运而生。现有的方法可划分为三大类别。第一种是使用通用和领...

用于恶意内容检测的LLMs:优点与缺点

这篇文章评估了两种不同的方法来识别互联网上的有害内容:训练监督分类器和使用大型语言模型

强化上下文文档检索:利用GPT-2和LlamaIndex

介绍 在信息检索的世界中,海量的文本数据等待探索,有效地定位相关文档的能力是非常宝贵的。传统的基于关键字的搜索存在一些...

在视觉Transformer中的ReLU与Softmax:序列长度是否重要?来自Google DeepMind研究论文的见解

一个常见的机器学习架构是变压器架构。变压器的主要部分之一是注意力,它具有生成跨标记的概率分布的softmax。由于指数计算和...

使用检索增强生成来减少AI幻觉

这种新设计的技术显示出在增加LLMs的知识方面很有前景,它通过使用专有数据来增强提示的能力

“Hugging Face 是 LLMs 的新 GitHub”

Hugging Face 正在成为大型语言模型(LLM)的“GitHub”Hugging Face 提供了简化 LLM 开发和部署的工具

将生成任务转化为分类任务

“通过训练更小、更专注于特定任务的分类模型,可以减轻大型通用语言模型的成本,从而提高效率”

AI能在创造性思维任务上胜过人类吗?这项研究为人类与机器学习创造力之间的关系提供了深入的见解

虽然AI在许多领域取得了巨大的进展,并成为一种有价值的工具,但它并不能替代人类独特的品质和能力。在许多情况下,最有效的...

OpenAI公布了DALL·E 3:文本到图像生成的革命性跃进

在技术上的一次重大飞跃中,OpenAI宣布推出了DALL·E 3,这是他们开创性的文本到图像生成技术的最新版本。DALL·E 3具备前所未...