Learn more about Staff - Section 13
这篇人工智能论文提出了MATLABER:一种新颖的潜在BRDF自编码器,用于材质感知的文本到3D生成
3D资产的开发对于许多商业应用非常重要,包括游戏、电影和AR/VR。传统的3D资产开发过程需要许多耗时且劳动密集的步骤,所有这...
解码情绪:用EmoTX,一种新的基于Transformer的AI框架揭示情感和心理状态
电影是最富有艺术表达力的故事和情感之一。例如,在《追求快乐》中,主角经历了一系列情绪变化,体验了分手和无家可归等低谷...
Deci推出DeciCoder:一款用于代码生成的开源1B参数大型语言模型
在快节奏的AI世界中,高效的代码生成是一个不容忽视的挑战。随着越来越复杂的模型的出现,对准确代码生成的需求也迅速增长,...
从文字到世界:使用AI多模态细粒度视频描述探索视频叙述
语言是人类互动的主要方式,不仅提供其他感官如视觉和听觉的补充细节,还作为传递信息的有效渠道,例如使用语音导航引导我们...
认识AudioLDM 2 一个独特的用于音频生成的AI框架,它融合了语音、音乐和音效
在一个越来越依赖于人工智能和深度学习概念的世界中,音频生成领域正在经历一场突破性的变革,引入了AudioLDM 2。这个创新框...
“认识EasyEdit:一款易于使用的用于LLMs的知识编辑AI框架”
我们不断需要跟上这个不断变化的世界,机器学习模型也需要如此,以产生精确的输出。大型语言模型通常会遇到谬误问题,即它们...
“遇见 SQLCoder:一种新的开源和顶尖模型,用于将自然语言问题转换为 SQL 查询”
Defog.ai发布了SQLCoder,这是一个先进的模型,用于将自然语言查询转化为数据库查询。针对Postgres中的通用SQL架构,SQLCoder...
“革命性的实时1080p新视角合成:基于3D高斯和可见性感知渲染的突破”
网格和点是最常见的三维场景表示,因为它们是明确的,非常适合于快速的GPU/CUDA光栅化。相比之下,最近的神经辐射场(NeRF)...
2023年视频创作和编辑的40多个AI工具
Adobe Premiere Pro Adobe Premiere Pro是一款具有AI功能的视频编辑软件,可以让用户快速创建令人惊叹的视频。其功能包括色彩...
Together AI发布了Llama-2-7B-32K-Instruct:扩展上下文语言处理的突破
在自然语言处理的广阔领域中,出现了一个多方面的挑战:即熟练理解和回应复杂而冗长的指令。随着沟通细微差别变得更加复杂,...
康奈尔大学的研究人员引入量化与不相关处理(QuIP):一种基于量化受益于不相关权重和黑塞矩阵的新的人工智能方法
通过大型语言模型 (LLM),在文本生成、少样本学习、推理和蛋白质序列建模等领域取得了进展。由于其巨大的规模,这些模型可能...
这篇人工智能论文的目标是基于每个角色的手部模型,在角色之间传递手部动作语义
在各种虚拟化头像的背景下,包括共同言语和手势合成,产生逼真的手势已经显示出潜力。人的手作为主要的非语言交流方式,可以...
麻省理工学院和哈佛大学的研究人员提出了一种名为FAn的全面人工智能系统,它弥合了最先进的计算机视觉和机器人系统之间的差距,为分割、检测、跟踪和跟随任何物体提供了端到端的解决方案
在一项新的人工智能研究中,麻省理工学院和哈佛大学的研究人员引入了一种开创性的框架,名为“Follow Anything”(FAn)。该系...
Line 开源了“japanese-large-lm”:一个具有36亿参数的日语语言模型
自2020年11月起,LINE开始了一项变革性的研发之旅,旨在创建和利用一个专门针对日语的先进大规模语言模型的力量。作为这一旅...
NVIDIA推出FlexiCubes:一种新的方法,用于从神经工作流(例如摄影测量和生成式AI)生成高质量网格
人工智能(AI)再次推动了可能性的边界,通过下一代AI管道在创建复杂而高保真度的3D模型方面取得了惊人的成功。这些模型涵盖...
遇见RAVEN:一种检索增强的编码器-解码器语言模型,解决ATLAS的局限性
大型语言模型(LLMs)在自然语言处理(NLP)领域的最新发展中发挥了重要作用。这些模型在各种任务上展示了惊人的能力,并显著...
揭示贝叶斯流网络:生成建模的新前沿
生成建模属于无监督机器学习的范畴,在这里模型学习发现输入数据中的模式。利用这些知识,模型可以自己生成与原始训练数据集...
超越笔尖:从视觉原型生成手写文本的人工智能艺术
风格化手写文本生成(HTG)是一个新兴领域,旨在创建手写文本图像,以复制个体作者独特的书法风格。这个研究领域具有多样的实...
CMU研究人员开发了一种简单的远程学习人工智能方法,将视觉先验知识转移到机器人任务中:相较于基准线,政策学习提高了20%
机器人学习进展的一个重要障碍是缺乏足够的大规模数据集。机器人学的数据集存在以下问题:(a) 难以扩展,(b) 在无菌、非真实...
Google AI推出STUDY:一种在教育环境中用于有声读物的社交感知-时间因果推荐系统
阅读对年轻学生大有裨益,从提高语言和生活技能到增强情感福祉。阅读快乐与学术成功之间的相关性已有充分的文献证明。此外,...
- You may be interested
- LoRa,QLoRA和QA-LoRA 通过低秩矩阵分解实...
- 扩散模型的好处和局限性
- 加州大学伯克利分校的研究人员引入了一种...
- 使用PyTorch进行高效图像分割:第3部分
- 2023年最佳网络安全新闻简报
- 使用Colab笔记本与Llama-2 7B模型进行聊天...
- 谷歌AI研究人员推出了HyperDreamBooth:这...
- AI内容检测器是如何工作的?
- 创建一个用于识别古典音乐作曲家的音频分...
- 认识ChatArena 一个Python库,旨在促进多...
- 规避AI工作市场启示录:幸存者指南—第一部分
- Python for Data Engineers’ 的翻译...
- 用户反馈——机器学习监控栈中的缺失环节
- 如何提升大型语言模型的质量?认识PIT:一...
- 失败、试验和成功:负二项分布解释