Learn more about Tech News - Section 10
“革命性的实时1080p新视角合成:基于3D高斯和可见性感知渲染的突破”
网格和点是最常见的三维场景表示,因为它们是明确的,非常适合于快速的GPU/CUDA光栅化。相比之下,最近的神经辐射场(NeRF)...
2023年视频创作和编辑的40多个AI工具
Adobe Premiere Pro Adobe Premiere Pro是一款具有AI功能的视频编辑软件,可以让用户快速创建令人惊叹的视频。其功能包括色彩...
Together AI发布了Llama-2-7B-32K-Instruct:扩展上下文语言处理的突破
在自然语言处理的广阔领域中,出现了一个多方面的挑战:即熟练理解和回应复杂而冗长的指令。随着沟通细微差别变得更加复杂,...
康奈尔大学的研究人员引入量化与不相关处理(QuIP):一种基于量化受益于不相关权重和黑塞矩阵的新的人工智能方法
通过大型语言模型 (LLM),在文本生成、少样本学习、推理和蛋白质序列建模等领域取得了进展。由于其巨大的规模,这些模型可能...
这篇人工智能论文的目标是基于每个角色的手部模型,在角色之间传递手部动作语义
在各种虚拟化头像的背景下,包括共同言语和手势合成,产生逼真的手势已经显示出潜力。人的手作为主要的非语言交流方式,可以...
麻省理工学院和哈佛大学的研究人员提出了一种名为FAn的全面人工智能系统,它弥合了最先进的计算机视觉和机器人系统之间的差距,为分割、检测、跟踪和跟随任何物体提供了端到端的解决方案
在一项新的人工智能研究中,麻省理工学院和哈佛大学的研究人员引入了一种开创性的框架,名为“Follow Anything”(FAn)。该系...
Line 开源了“japanese-large-lm”:一个具有36亿参数的日语语言模型
自2020年11月起,LINE开始了一项变革性的研发之旅,旨在创建和利用一个专门针对日语的先进大规模语言模型的力量。作为这一旅...
遇见RAVEN:一种检索增强的编码器-解码器语言模型,解决ATLAS的局限性
大型语言模型(LLMs)在自然语言处理(NLP)领域的最新发展中发挥了重要作用。这些模型在各种任务上展示了惊人的能力,并显著...
揭示贝叶斯流网络:生成建模的新前沿
生成建模属于无监督机器学习的范畴,在这里模型学习发现输入数据中的模式。利用这些知识,模型可以自己生成与原始训练数据集...
超越笔尖:从视觉原型生成手写文本的人工智能艺术
风格化手写文本生成(HTG)是一个新兴领域,旨在创建手写文本图像,以复制个体作者独特的书法风格。这个研究领域具有多样的实...
CMU研究人员开发了一种简单的远程学习人工智能方法,将视觉先验知识转移到机器人任务中:相较于基准线,政策学习提高了20%
机器人学习进展的一个重要障碍是缺乏足够的大规模数据集。机器人学的数据集存在以下问题:(a) 难以扩展,(b) 在无菌、非真实...
Google AI推出STUDY:一种在教育环境中用于有声读物的社交感知-时间因果推荐系统
阅读对年轻学生大有裨益,从提高语言和生活技能到增强情感福祉。阅读快乐与学术成功之间的相关性已有充分的文献证明。此外,...
麻省理工学院和哈佛大学的研究人员提出了一个假设,可以解释如何使用大脑中的生物元素构建一个变压器
人工神经网络是机器学习中常见的模型,可以用于各种任务的训练,其结构类似于人脑中的神经元信息处理方法,受人脑启发。 变形...
这篇来自纽约大学和谷歌的论文解释了联合语音文本编码器如何在跨模态表示中克服序列长度不匹配的问题
I had trouble accessing your link so I’m going to try to continue without it. 越来越明显的是,通过在单一模态上...
扩散变压器(DiTs)用于前所未有的架构创新:使用基于Transformer的扩散模型改变图像生成
机器学习的发展已经经历了一次变革性的转变,随着基于transformer的架构的出现,它彻底改变了自然语言处理、计算机视觉等任务...
遇见Embroid:一种AI方法,可以将LLM与来自多个较小模型的嵌入信息相互拼接,从而实现在没有监督的情况下自动纠正LLM预测
假设您编写了一种语言模型(LM)来对药物和医疗史进行基本数据分析。为了训练您的机器学习模型,您需要带有各种病人历史数据...
“见证JEN-1:一个通用的AI框架,结合双向和单向模式,用于根据文本或音乐表达生成高质量的音乐”
音乐被亨利·沃兹沃斯·朗费罗誉为人类的普遍语言,它蕴含和谐、旋律和节奏的精髓,编织出一幅文化意义的图景,与世界各地的人...
微软推出Azure ChatGPT:专为企业量身定制的ChatGPT私有版本
Microsoft Azure ChatGPT是一项开创性的提供,使企业能够在其网络生态系统中利用ChatGPT的能力,促进更加流畅和高效的工作环...
遇见3D-VisTA:一种预训练的3D视觉和文本对齐Transformer,可以轻松适应各种下游任务
I had trouble accessing your link so I’m going to try to continue without it. 在人工智能的动态领域中,不断的进...
Google DeepMind研究人员介绍了SynJax:一种用于JAX结构化概率分布的深度学习库
数据可以被视为在各个领域中具有结构,解释了其组成部分如何组合成一个更大的整体。根据活动的不同,这种结构通常是潜在的并...
- You may be interested
- 这篇人工智能论文提供了机器学习流程中各...
- 规模化的机器学习:模型与数据并行性
- 最佳AWS课程(2024年)
- 如何使基于模型的基础保持最新数据?苹果...
- 数据科学为善:超越利润,走向更美好的世界
- 刑事律师警告称,人工智能可能会让法庭“怀...
- 2023年8月最佳10款可在任何地方使用的Spot...
- 使用提示和技巧对文本分类任务进行即时工程
- 用3个ChatGPT提示(Alex Hormozi方法)扩...
- 谷歌的“关于这个图像”功能:AI生成的错误...
- 使用Python构建和验证简单的股票交易算法
- OpenAI介绍超级对齐:为安全和对齐的人工...
- 小猪AI新闻,5月31日:数据科学备忘录中的...
- SnapLogic如何利用Amazon Bedrock构建了一...
- 美国前十大数据科学公司