Learn more about language model - Section 17

塑造人工智能的未来 AI：快速工程对于进步和创新的重要性

ChatGPT自发布以来一直备受瞩目。已有超过一百万用户在使用这个革命性的聊天机器人进行交互。对于不了解的人来说，ChatGPT是...

小型语言模型能够提供高性能吗？认识一下StableLM：一种开源的语言模型，能够通过适当的训练生成文本和代码，提供高性能

Stability AI是一家人工智能领域的初创公司，以其稳定扩散图像生成AI技术而闻名。今天，它推出了一个名为StableLM的新的免费...

斯坦福大学的研究人员介绍了Parsel：一种人工智能AI框架，可以通过代码实现和验证复杂算法，并支持大型语言模型LLMs的自动化实施

尽管近年来在大型语言模型（LLM）推理方面取得了一些进展，但LLM仍然在分层多步推理任务（如开发复杂程序）方面遇到困难。与...

Eleuther AI研究团队展示了如何将无分类器引导（CFG）与LLMs一起使用

最近，巨型语言模型展示了令人印象深刻的生成能力，使它们能够处理各种各样的问题。通常，”提示”被用来在生成过...

为什么深度学习总是在数组数据上进行？新的人工智能研究引入了“空间函数”，将从数据到函数的处理视为一个整体

隐式神经表示（INRs）或神经场是基于坐标的神经网络，通过将3D坐标映射到3D空间中的颜色和密度值来表示场景，例如3D场景。最...

如果您使用光学神经网络运行Transformer模型会发生什么？

深度学习模型的指数级扩展是推动最新技术进展的重要力量，也是人们越来越担心能源消耗、速度以及大规模深度学习的可行性的来...

CMU研究人员推出FROMAGe：一种能够高效引导冻结的大型语言模型（LLMs）生成与图像交错的自由文本的人工智能模型

巨大的大型语言模型（LLMs）能够展示出人类般的表达能力和对复杂问题的回应，因为它们在大规模的文本语料库上进行了规模化训...

一个新的AI研究介绍了AttrPrompt：一种用于零样本学习新范式的LLM作为训练数据生成器

大型语言模型（LLMs）在许多不同的自然语言处理（NLP）应用中表现出色。最近的研究中，LLMs已被提出作为特定任务训练数据生成...

能够严格检查的LLMs是否能够生成数学证明？了解LeanDojo：一个开源的AI游乐场，提供工具包、基准测试和模型，用于大型语言模型在Lean证明助手中证明形式化定理

人工智能和机器学习是当今时代的热门领域。随着人工智能取得的巨大进步，新的创新正在改变人类与机器的互动方式。人类智能中...

百度Ernie 3.5在中文语言AI领域脱颖而出：但它真的比ChatGPT更好吗？

在中国语言AI市场上取得了令人振奋的突破，著名的搜索引擎提供商百度发布了其最新模型Ernie 3.5。百度声称这款大型中文语言模...

随着OpenFlamingo团队发布了OpenFlamingo v2，该团队在3B、4B和9B规模上推出了五个新的多模态模型，这些模型表现优于之前的模型

来自华盛顿大学、斯坦福大学、AI2、加州大学圣塔芭芭拉分校和谷歌的一组研究人员最近开发了OpenFlamingo项目，旨在构建类似De...

认识LOMO（LOw-Memory Optimization）：一种新的AI优化器，它将梯度计算和参数更新融合为一步，以减少内存使用

大规模语言模型通过展示出色的技能，如自发性和理解力，并不断增加模型的大小，改变了自然语言处理。通过使用数十亿个参数来...

构建语言模型：一步一步的BERT实现指南

介绍过去几年中，处理语言的机器学习模型取得了快速的进展。这一进展已经离开了研究实验室，开始为一些领先的数字产品提供动...

认识Wanda：一种简单有效的大型语言模型修剪方法

大型语言模型（LLMs）的流行度和使用率不断增长。在生成式人工智能领域取得巨大成功的同时，这些模型正在引领一些巨大的经济...

遇见ChatGLM2-6B 开源双语（中英文）聊天模型ChatGLM-6B的第二代版本

自OpenAI推出了革命性的ChatGPT以来，该产品以最快的速度获得了1亿用户，自然语言对话代理领域取得了可观的进展。研究人员正...

转换专业AI训练-遇见LMFlow：一个有前景的工具包，可高效微调和个性化大型基础模型以提供卓越性能

建立在大型基础模型之上的大型语言模型（LLMs）已经展示了执行以前不可能的各种任务的一般能力。然而，需要更多对这些LLMs进...

认识ChatArena 一个Python库，旨在促进多个大型语言模型（LLMs）之间的通信和协作

ChatArena是一个Python软件包，旨在帮助各种巨型语言模型协同工作。ChatArena已经包含了一个多智能体对话模拟环境。参与者的...

斯坦福研究人员推出SequenceMatch：使用模仿学习损失训练LLMs

自回归模型是一类基于变量当前值高度依赖于其过去值的统计模型。换句话说，该模型通过将变量回归其过去值来预测变量的未来值...

机器狗以 MJ 风格跳月步：这项 AI 研究提出使用以代码表示的奖励作为 LLM 与基于优化的动作控制器之间灵活的接口

近年来，人工智能行业已经占据了世界。几乎每天都有新的独特研究和模型发布，AI正在不断发展和变得更加优秀。无论我们考虑医...

Voxel51开源VoxelGPT：一种利用GPT-3.5的能力生成Python代码进行计算机视觉数据集分析的AI助手

Voxel51是数据中心计算机视觉和机器学习软件领域的杰出创新者之一，最近推出了计算机视觉领域的一个重大突破，推出了VoxelGPT...

Image Description

Your AI Partner

Image Description

Exploring the future with AI

Web Analytics