Learn more about Large Language Model - Section 3
见面RecMind:一种由大型语言模型技术驱动的自主推荐代理,结合了推理、行动和记忆的各种推荐任务
随着人工智能和深度学习的普及,几乎每个应用都在利用人工智能的能力来完成任务。深度神经网络(DNN)在现代化推荐系统中起着...
微软开源VALLE-X:多语言文本语音合成和语音克隆模型
在推动文本转语音合成和语音克隆的边界的探索中,微软的VALL-E X零样本TTS模型的开源实现出现了。此次发布承诺允许爱好者和专...
“聊天GPT真的中立吗?关于AI驱动的对话代理的政治偏见的实证研究”
最近,来自英国和巴西的研究人员进行的一项研究揭示了对ChatGPT的客观性的担忧,ChatGPT是OpenAI开发的一种流行的AI语言模型...
普林斯顿大学的研究人员推出了MeZO:一种内存高效的零阶优化器,可以对大型语言模型(LLMs)进行微调
大型语言模型在过去几个月中以生成式人工智能的巨大成功快速发展。这些模型为一些令人瞩目的经济和社会转型做出了贡献,其中...
遇见SelFee:一种由自反馈生成驱动的迭代自我修订LLM
最近的一项研究强调了自然语言反馈在提高语言模型性能方面的有效性。韩国科学技术院的研究人员引入了一种新的SelFee模型,专...
来自UCL和Google的研究人员提出了AudioSlots 一种以插槽为中心的音频域盲源分离生成模型
最近,神经网络在处理结构化数据并从非结构化输入映射到结构化输出空间的架构中得到了广泛关注。尤其在视觉领域中,对象识别...
华盛顿大学和AI2研究人员引入了TIFA:一种通过VQA测量AI生成图像忠实度的自动评估指标
文本到图像生成模型是人工智能领域发展的最好例子之一。通过研究人员不断的进展和努力,这些模型已经走了很长的路。尽管文本...
GPT模型的可信度深度分析
最近的一项全球民意调查中,超过一半的受访者表示,尽管存在幻觉、虚假信息和偏见等问题,他们仍将利用这种新兴技术进行敏感...
ETH Zurich 的研究人员推出了GoT(思维图):一种机器学习框架,能够提升大型语言模型(LLMs)的提示能力
人工智能(AI)在使用大型语言模型(LLMs)方面有所增加。最近,基于Transformer架构的仅解码器设计的一种特殊类型的LLM已经...
“认识AutoGPTQ:基于GPTQ算法的易于使用的LLMs量化包,提供用户友好的API”
来自Hugging Face的研究人员提出了一种创新解决方案,以应对训练和部署大型语言模型(LLMs)所需的资源密集型需求。他们在Tra...
Meta AI发布了SeamlessM4T:一个基础的多语言和多任务模型,可以在语音和文本之间无缝地进行翻译和转录
在一个越来越全球化的互动世界中,掌握多种语言可以弥合鸿沟,促进理解,并为各种机遇打开大门。学习多种语言可以帮助我们深...
Deci推出DeciCoder:一款用于代码生成的开源1B参数大型语言模型
在快节奏的AI世界中,高效的代码生成是一个不容忽视的挑战。随着越来越复杂的模型的出现,对准确代码生成的需求也迅速增长,...
认识AudioLDM 2 一个独特的用于音频生成的AI框架,它融合了语音、音乐和音效
在一个越来越依赖于人工智能和深度学习概念的世界中,音频生成领域正在经历一场突破性的变革,引入了AudioLDM 2。这个创新框...
“认识EasyEdit:一款易于使用的用于LLMs的知识编辑AI框架”
我们不断需要跟上这个不断变化的世界,机器学习模型也需要如此,以产生精确的输出。大型语言模型通常会遇到谬误问题,即它们...
“遇见 SQLCoder:一种新的开源和顶尖模型,用于将自然语言问题转换为 SQL 查询”
Defog.ai发布了SQLCoder,这是一个先进的模型,用于将自然语言查询转化为数据库查询。针对Postgres中的通用SQL架构,SQLCoder...
Together AI发布了Llama-2-7B-32K-Instruct:扩展上下文语言处理的突破
在自然语言处理的广阔领域中,出现了一个多方面的挑战:即熟练理解和回应复杂而冗长的指令。随着沟通细微差别变得更加复杂,...
Line 开源了“japanese-large-lm”:一个具有36亿参数的日语语言模型
自2020年11月起,LINE开始了一项变革性的研发之旅,旨在创建和利用一个专门针对日语的先进大规模语言模型的力量。作为这一旅...
遇见RAVEN:一种检索增强的编码器-解码器语言模型,解决ATLAS的局限性
大型语言模型(LLMs)在自然语言处理(NLP)领域的最新发展中发挥了重要作用。这些模型在各种任务上展示了惊人的能力,并显著...
这篇来自纽约大学和谷歌的论文解释了联合语音文本编码器如何在跨模态表示中克服序列长度不匹配的问题
I had trouble accessing your link so I’m going to try to continue without it. 越来越明显的是,通过在单一模态上...
扩散变压器(DiTs)用于前所未有的架构创新:使用基于Transformer的扩散模型改变图像生成
机器学习的发展已经经历了一次变革性的转变,随着基于transformer的架构的出现,它彻底改变了自然语言处理、计算机视觉等任务...
- You may be interested
- ODSC西部2023主题演讲:负责任地构建和使...
- 这是真正的多模学习吗?—解析ImageBind
- Google AI推出STUDY:一种在教育环境中用...
- 亲自动手的深度 Q 学习
- 介绍 Optimum:大规模变压器的优化工具包
- 新工具帮助人们选择正确的方法来评估AI模型
- “如何使用合成数据来训练大型语言模型”
- “通过AI数据集成和基于内容的映射来引领未来”
- Google AI的AdaTape是一种基于Transformer...
- 在Slack消息中微调LLM
- 从Stitch Fix建立的ML平台中学到的东西
- 机器人模仿了一个4.5亿年前灭绝的海洋生物
- AVIS内部:Google的新视觉信息搜索LLM
- NotebookLM增加了超过十几个新功能
- 使用PyTorch进行高效图像分割:第3部分