Learn more about language model - Section 17
塑造人工智能的未来 AI:快速工程对于进步和创新的重要性
ChatGPT自发布以来一直备受瞩目。已有超过一百万用户在使用这个革命性的聊天机器人进行交互。对于不了解的人来说,ChatGPT是...
小型语言模型能够提供高性能吗?认识一下StableLM:一种开源的语言模型,能够通过适当的训练生成文本和代码,提供高性能
Stability AI是一家人工智能领域的初创公司,以其稳定扩散图像生成AI技术而闻名。今天,它推出了一个名为StableLM的新的免费...
斯坦福大学的研究人员介绍了Parsel:一种人工智能AI框架,可以通过代码实现和验证复杂算法,并支持大型语言模型LLMs的自动化实施
尽管近年来在大型语言模型(LLM)推理方面取得了一些进展,但LLM仍然在分层多步推理任务(如开发复杂程序)方面遇到困难。与...
Eleuther AI研究团队展示了如何将无分类器引导(CFG)与LLMs一起使用
最近,巨型语言模型展示了令人印象深刻的生成能力,使它们能够处理各种各样的问题。通常,”提示”被用来在生成过...
为什么深度学习总是在数组数据上进行?新的人工智能研究引入了“空间函数”,将从数据到函数的处理视为一个整体
隐式神经表示(INRs)或神经场是基于坐标的神经网络,通过将3D坐标映射到3D空间中的颜色和密度值来表示场景,例如3D场景。最...
如果您使用光学神经网络运行Transformer模型会发生什么?
深度学习模型的指数级扩展是推动最新技术进展的重要力量,也是人们越来越担心能源消耗、速度以及大规模深度学习的可行性的来...
CMU研究人员推出FROMAGe:一种能够高效引导冻结的大型语言模型(LLMs)生成与图像交错的自由文本的人工智能模型
巨大的大型语言模型(LLMs)能够展示出人类般的表达能力和对复杂问题的回应,因为它们在大规模的文本语料库上进行了规模化训...
一个新的AI研究介绍了AttrPrompt:一种用于零样本学习新范式的LLM作为训练数据生成器
大型语言模型(LLMs)在许多不同的自然语言处理(NLP)应用中表现出色。最近的研究中,LLMs已被提出作为特定任务训练数据生成...
能够严格检查的LLMs是否能够生成数学证明?了解LeanDojo:一个开源的AI游乐场,提供工具包、基准测试和模型,用于大型语言模型在Lean证明助手中证明形式化定理
人工智能和机器学习是当今时代的热门领域。随着人工智能取得的巨大进步,新的创新正在改变人类与机器的互动方式。人类智能中...
百度Ernie 3.5在中文语言AI领域脱颖而出:但它真的比ChatGPT更好吗?
在中国语言AI市场上取得了令人振奋的突破,著名的搜索引擎提供商百度发布了其最新模型Ernie 3.5。百度声称这款大型中文语言模...
随着OpenFlamingo团队发布了OpenFlamingo v2,该团队在3B、4B和9B规模上推出了五个新的多模态模型,这些模型表现优于之前的模型
来自华盛顿大学、斯坦福大学、AI2、加州大学圣塔芭芭拉分校和谷歌的一组研究人员最近开发了OpenFlamingo项目,旨在构建类似De...
认识LOMO(LOw-Memory Optimization):一种新的AI优化器,它将梯度计算和参数更新融合为一步,以减少内存使用
大规模语言模型通过展示出色的技能,如自发性和理解力,并不断增加模型的大小,改变了自然语言处理。通过使用数十亿个参数来...
构建语言模型:一步一步的BERT实现指南
介绍 过去几年中,处理语言的机器学习模型取得了快速的进展。这一进展已经离开了研究实验室,开始为一些领先的数字产品提供动...
认识Wanda:一种简单有效的大型语言模型修剪方法
大型语言模型(LLMs)的流行度和使用率不断增长。在生成式人工智能领域取得巨大成功的同时,这些模型正在引领一些巨大的经济...
遇见ChatGLM2-6B 开源双语(中英文)聊天模型ChatGLM-6B的第二代版本
自OpenAI推出了革命性的ChatGPT以来,该产品以最快的速度获得了1亿用户,自然语言对话代理领域取得了可观的进展。研究人员正...
转换专业AI训练-遇见LMFlow:一个有前景的工具包,可高效微调和个性化大型基础模型以提供卓越性能
建立在大型基础模型之上的大型语言模型(LLMs)已经展示了执行以前不可能的各种任务的一般能力。然而,需要更多对这些LLMs进...
认识ChatArena 一个Python库,旨在促进多个大型语言模型(LLMs)之间的通信和协作
ChatArena是一个Python软件包,旨在帮助各种巨型语言模型协同工作。ChatArena已经包含了一个多智能体对话模拟环境。参与者的...
斯坦福研究人员推出SequenceMatch:使用模仿学习损失训练LLMs
自回归模型是一类基于变量当前值高度依赖于其过去值的统计模型。换句话说,该模型通过将变量回归其过去值来预测变量的未来值...
机器狗以 MJ 风格跳月步:这项 AI 研究提出使用以代码表示的奖励作为 LLM 与基于优化的动作控制器之间灵活的接口
近年来,人工智能行业已经占据了世界。几乎每天都有新的独特研究和模型发布,AI正在不断发展和变得更加优秀。无论我们考虑医...
Voxel51开源VoxelGPT:一种利用GPT-3.5的能力生成Python代码进行计算机视觉数据集分析的AI助手
Voxel51是数据中心计算机视觉和机器学习软件领域的杰出创新者之一,最近推出了计算机视觉领域的一个重大突破,推出了VoxelGPT...
- You may be interested
- 解码情绪:用EmoTX,一种新的基于Transfor...
- 2023年排名前五的最佳建筑学院
- 顶级140+生成式人工智能工具,能够让你的...
- 用生存分析探索事件发生时间
- “开源”人工智能的神话
- 如何在2023年成为数据策略师?
- BERT vs GPT:比较自然语言处理巨头
- 多模态数据集成:人工智能如何改变癌症护理
- 使用Amazon SageMaker上的联邦学习,使用...
- 分而治之,团结一致:CoTracker是一种联合...
- 深入泳池:揭开CNN池化层的魔力
- 为负责任的生成式人工智能建立标准
- 探索将ChatGPT集成到医疗保健中的优点和缺点
- 深度学习锈烧图书馆
- 2023年8月最佳AI工具的联盟营销(Affiliat...