Learn more about Large Language Model - Section 5
遇见ToolLLM:一种数据构建和模型训练的通用工具使用框架,增强了大型语言模型的API使用
为了高效地连接众多工具(API)并完成困难的任务,工具学习试图利用大型语言模型(LLMs)的潜力。通过与API连接,LLMs可以显...
大型语言模型作为税务律师:这篇人工智能论文探讨了大型语言模型在应用税法方面的能力
人工智能取得了进展。大型语言模型(LLMs)是快速进展的地方。现代LLMs可以使用工具、规划和通过标准化评估。但即使对于其创...
揭开作者面纱:AI还是人类?探索IBM创新的文本检测工具中AI取证的出现
在人工智能快速发展的时代,一个重要的挑战需要关注:生成式人工智能的透明度和可信度。IBM的研究人员致力于为世界提供AI检测...
遇见 Skill-it:一种基于数据驱动的技能框架,用于理解和训练语言模型
大型语言模型(LM)在编写源代码、创作艺术作品和与人交谈方面具有非凡的能力。用于训练模型的数据使它们能够执行这些任务。...
认识QLORA:一种高效的微调方法,可以降低内存使用量,使得在单个48GB的GPU上微调一个65B参数的模型,并保持完整的16位微调任务性能
大型语言模型(LLM)可以通过微调来改进,这也允许添加或删除所需的行为。然而,微调大型模型成本过高;例如,一个65B参数的L...
认识 Med-PaLM 多模态(Med-PaLM M):一个大型多模态生成模型,可以灵活地编码和解释生物医学数据
大型语言模型(LLMs)在几乎所有领域都取得了进展,从医疗保健和金融到教育和社交媒体。医疗行业的临床医生依赖各种各样的数...
“先有梦想,后学习:DECKARD是一种利用LLMs训练强化学习(RL)智能体的AI方法”
强化学习(RL)是训练可以通过与环境交互学习完成复杂任务的自主代理的流行方法。RL使它们能够在不同条件下学习最佳动作,并...
斯坦福大学研究人员推出了Sophia:一种可扩展的语言模型预训练的二阶优化器
鉴于训练语言模型的高昂成本,对优化过程进行非平凡改进将极大地减少完成训练过程所需的时间和金钱。Adam及其变种长时间以来...
一项新的人工智能研究解释了如何通过上下文指导学习(ICIL)来提高预训练和指导微调模型的零样本任务泛化性能
大型语言模型(LLMs)通过一种称为few-shot演示的过程,在推理过程中展示出了它们可以适应目标任务的能力,有时也被称为上下...
大型语言模型(LLM)(如ChatGPT)为何在微调时使用强化学习而不是监督学习的5个原因
随着生成式人工智能在过去几个月取得的巨大成功,大型语言模型不断进步和改进。这些模型正在为一些值得注意的经济和社会转型...
斯坦福大学的研究人员介绍了局部条件扩散:一种使用扩散模型进行组合式文本到图像生成的方法
3D场景建模传统上是一项耗时的过程,只有具有领域专业知识的人才能进行。尽管在公共领域中有大量的3D材料可用,但很难找到与...
ChatGPT的行为随时间变化吗?研究人员评估了GPT-3.5和GPT-4的2023年3月版和2023年6月版在四个不同任务上的表现
大型语言模型(LLMs)已成功证明是人工智能领域中最好的创新。从BERT、PaLM和GPT到LLaMa DALL-E,这些模型在理解和生成语言以...
Salesforce AI开发了一种名为EDICT的新编辑算法,它可以通过可逆过程在现有的扩散模型中执行文本到图像的扩散生成
随着技术和人工智能领域的最新进展,出现了许多创新。无论是使用超级热门的ChatGPT模型生成文本还是从文本生成图像,现在都是...
稳定AI团队推出FreeWilly1和FreeWilly2:全新的开放获取大型语言模型(LLMs)
FreeWilly1及其继任者FreeWilly2是由Stability AI的CarperAI团队开发的功能强大的新开源大型语言模型(LLM)。这两个模型在使...
“LLM能够在您的iPhone上运行吗?认识MLC-LLM:这是一个开放框架,可以直接将语言模型(LLMs)带入一类带有GPU加速的平台”
大型语言模型(LLM)是人工智能领域当前的热门话题。在医疗保健、金融、教育、娱乐等广泛行业中已经取得了相当程度的进展。著...
一项新的AI研究提出了一种以提示为中心的方法来分析大型语言模型(LLMs)的能力
近年来,大型语言模型(LLMs)的使用急剧增长,彻底改变了自然语言处理(NLP)领域,尤其是促使LLMs生成开放式文本。开放式文...
斯坦福大学的研究人员开发了一种名为“RoentGen”的人工智能(AI)模型,该模型基于稳定扩散,并在大型胸部X射线和放射学数据集上进行了微调
潜在扩散模型(LDMs)是去噪扩散模型的一个子类,最近因为能够以高保真度、多样性和分辨率生成图像而变得重要。这些模型在推...
我们知道LLMs可以使用工具,但你知道它们也可以制造新的工具吗?来认识一下LLMs作为工具制造者(LATM):一个闭环系统,允许LLMs制造自己的可重复使用工具
大型语言模型(LLMs)在广泛的自然语言处理任务中表现出色,并显示出实现某些人工智能普适特征的鼓舞人心证据。最近的研究还...
这篇AI论文提出了保留网络(RetNet)作为大型语言模型的基础架构:实现训练并行性、低成本推理和良好的性能
Transformer(变压器)最初是为了解决循环模型中的顺序训练问题而开发的,后来被公认为大型语言模型的事实标准架构。变压器的...
意大利的一项新的人工智能研究介绍了一种基于扩散的生成模型,能够同时进行音乐合成和音源分离
人类有能力同时处理多个声音源,无论是在音乐作曲或合成与分析,即源分离方面。换句话说,人脑可以从混合物中分离出单个声音...
- You may be interested
- 构建一条端到端的边缘视觉质量检验的MLOps...
- 创建一个可持续的供应链优化Web应用程序
- 注意游戏行业!镜像神经辐射场不再奇怪了
- 多模态语言模型:人工智能(AI)的未来
- 数学家们为三体问题找到了12,000个解决方案
- 使用Amazon SageMaker探索医疗摘要选项
- 跨越AI深渊:OpenAI如何让LLMs成为主流成功
- 越来越多的开发者开始使用 Rust 语言
- 残疾儿童也是游戏玩家
- ‘RAG 应用设计中的实践考虑因素’
- 这项人工智能研究帮助微生物学家鉴定细菌
- 2024年的全面NLP学习路线
- PyrOSM:使用Open Street Map数据
- 在本地使用CPU推理运行Llama 2进行文档问答
- ELS+流工具