Learn more about language model - Section 7
这篇AI论文介绍了COVE方法:一种通过自我验证来解决语言模型幻觉的新型AI方法
使用包含数十亿个文本令牌的大型文本文档语料库来训练大型语言模型(LLM)。已经证明,随着模型参数数量的增加,性能在像关闭书...
麻省理工学院和香港中文大学的研究人员提出了LongLoRA(长期低秩适应):一种用于长上下文大语言模型(LLMs)的高效微调AI方法
大型语言模型(LLMs)的引入对人工智能领域带来了显著的进展。基于自然语言处理(NLP)、自然语言理解(NLU)和自然语言生成...
大型语言模型对话应用程序:理解用户输入、提示和回复的顺序
本文解释了用户输入如何被处理、转换为提示,发送到LLMs,并生成和呈现给用户的回应
面对 LMSYS-Chat-1M:一个包含2500万条与25个最先进的LLM进行的真实世界对话的大规模数据集
大型语言模型(LLMs)已经成为各种人工智能应用的重要组成部分,从虚拟助手到代码生成。当与LLMs互动时,用户会根据不同的目...
清华大学研究人员推出OpenChat:一种新型的人工智能AI框架,通过混合质量数据增强开源语言模型
在快速发展的自然语言处理领域中,大型语言模型的能力已经成倍增长。全球的研究人员和机构不断推动这些模型的界限,以改善它...
这篇来自微软的AI论文介绍了一种新的训练语言模型的方法:模仿人类阅读理解,提高生物医学、金融和法律领域的性能表现
由于普通大型语言模型(LLM)过度饱和,领域特定的大型语言模型应运而生。现有的方法可划分为三大类别。第一种是使用通用和领...
用于恶意内容检测的LLMs:优点与缺点
这篇文章评估了两种不同的方法来识别互联网上的有害内容:训练监督分类器和使用大型语言模型
这项AI研究提出了LayoutNUWA:一种将布局生成视为代码生成任务的AI模型,以增强语义信息并利用大型语言模型(LLMs)的隐藏布局专长
随着LLMs的增长,对LLMs的各个方面进行了彻底的研究。因此,图形布局也进行了研究。图形布局,即设计元素的排列和放置方式,...
强化上下文文档检索:利用GPT-2和LlamaIndex
介绍 在信息检索的世界中,海量的文本数据等待探索,有效地定位相关文档的能力是非常宝贵的。传统的基于关键字的搜索存在一些...
UCSD研究人员开源了Graphologue:一种独特的AI技术,可以将诸如GPT-4响应之类的大型语言模型实时转化为交互式图表
大型语言模型(LLMs)由于其易于获取和出色的生成文本响应能力而近来备受瞩目,可为各种用户查询提供答案。超过十亿人使用了...
在视觉Transformer中的ReLU与Softmax:序列长度是否重要?来自Google DeepMind研究论文的见解
一个常见的机器学习架构是变压器架构。变压器的主要部分之一是注意力,它具有生成跨标记的概率分布的softmax。由于指数计算和...
使用检索增强生成来减少AI幻觉
这种新设计的技术显示出在增加LLMs的知识方面很有前景,它通过使用专有数据来增强提示的能力
Deci AI推出DeciDiffusion 1.0:一个8.2亿参数的文本到图像潜在扩散模型,速度比稳定扩散快3倍
定义问题 文本到图像生成一直是人工智能领域的一个挑战。将文本描述转化为生动、逼真的图像是迈向自然语言理解和视觉内容创作...
大型语言模型在长篇问答中的表现如何?Salesforce研究人员对LLM的鲁棒性和能力进行了深入探究
尽管ChatGPT和GPT-4等大型语言模型(LLMs)在多个基准测试中表现出更好的性能,但MMLU和OpenLLMBoard等开源项目在多个应用和...
“Hugging Face 是 LLMs 的新 GitHub”
Hugging Face 正在成为大型语言模型(LLM)的“GitHub”Hugging Face 提供了简化 LLM 开发和部署的工具
这篇由微软和清华大学进行的人工智能研究介绍了EvoPrompt:一种新颖的人工智能框架,用于自动离散提示优化,连接LLMs和进化算法
大型语言模型(LLMs)在几乎所有自然语言处理(NLP)任务上都表现出色。然而,传统的微调方法对LLMs来说代价高昂,因此发展了...
将生成任务转化为分类任务
“通过训练更小、更专注于特定任务的分类模型,可以减轻大型通用语言模型的成本,从而提高效率”
AI能在创造性思维任务上胜过人类吗?这项研究为人类与机器学习创造力之间的关系提供了深入的见解
虽然AI在许多领域取得了巨大的进展,并成为一种有价值的工具,但它并不能替代人类独特的品质和能力。在许多情况下,最有效的...
OpenAI公布了DALL·E 3:文本到图像生成的革命性跃进
在技术上的一次重大飞跃中,OpenAI宣布推出了DALL·E 3,这是他们开创性的文本到图像生成技术的最新版本。DALL·E 3具备前所未...
“视频分割可以更具成本效益吗?认识DEVA:一种解耦的视频分割方法,可以节省注释并在不同任务之间泛化”
你是否曾经想过监控系统是如何工作的,以及我们如何仅通过视频来识别个人或车辆?或者如何通过水下纪录片来识别虎鲸?或者是...
- You may be interested
- 将人工智能融入一个紧密联系的团队的技巧...
- 避免神经网络中的过拟合:深入探讨
- 大型语言模型(LLMs)的软硬件协同优化策...
- 利用SQL中的分析函数加快数据提取速度
- 引领一股在非洲推动机器学习发展的运动
- 将ChatGPT与ReactJS集成以打造更智能的对...
- 《成为一名提示工程师是什么样的》
- HuggingFace推出TextEnvironments:一个机...
- 在几秒钟内使用ChatGPT生成令人惊叹的数据...
- 颠覆性的电子邮件效率:SaneBox的人工智能...
- 通过人类关注预测模型实现令人愉悦的用户体验
- 可视化Sklearn交叉验证:K-Fold、洗牌和分...
- 探索营销组合建模中生成响应曲线的不同方法
- “无需重新培训即可改变模特的记忆形态”
- 经过击败机器人对手后,雄性果蝇更擅长交配