Learn more about Applications - Section 3
遇见Vchitect:一款用于文本到视频(T2V)和图像到视频(I2V)应用的开源大规模综合视频创作系统
最近,人工智能(AI)的普及度呈指数增长,这导致了深度生成模型的一些重大进展。这些模型已应用于视频生成领域,用于创造图...
Adobe 研究人员提出了 DMV3D:一种新颖的 3D 生成方法,使用基于 Transformer 的 3D 大型重建模型来去噪多视角扩散
在增强现实(AR)、虚拟现实(VR)、机器人技术和游戏领域中,3D资产创建面临着一个普遍的挑战。3D扩散模型的流行度激增,该...
这项AI研究推出了CoDi-2:一种突破性的多模态大型语言模型,改变了交错指令处理和多模态输出生成的领域
研究人员在加州大学伯克利分校、微软Azure AI、Zoom和北卡罗来纳大学教堂山分校共同开发了CoDi-2多模态大语言模型(MLLM),...
MIT和Adobe的研究人员介绍了Distribution Matching Distillation(DMD):一种人工智能方法,可以将扩散模型转化为一步生成图像的方法
通过稳定的训练过程,扩散模型已经改变了图片生成的方式,实现了以往无法想象的多样性和真实度。但与GAN和VAE不同,扩散模型...
谷歌研究人员揭示通用自洽性(USC):为复杂任务性能提供大型语言模型的新飞跃
Google的研究人员通过他们的Universal Self-Consistency(USC)方法解决了在任务性能上增强数学推理和代码生成等任务中从多个...
顶级人工智能电子邮件助手(2023年12月)
人工智能电子邮件助手使编写电子邮件更快更容易。自动任务完成,消息优先级和即时,深入的答案只是人工智能电子邮件助手如何...
少量数据标注 + 更多 AI = 深度主动学习
训练人工智能(AI)模型通常需要大量标记数据。这可能非常昂贵和耗时,尤其是对于像图像识别或自然语言处理这样的复杂任务。...
与ChatGPT相对应的是谷歌的Gemini
在不断发展的人工智能世界中,谷歌通过其最新的创作Gemini AI迈出了重大的一步。据谷歌称,Gemini 是他们目前最具能力和通用...
“认识Ego-Exo4D:一套支持视频学习和多模式感知研究的基础数据集和基准套件”
如今,人工智能几乎应用于几乎所有可以想象的领域。它无疑改变了我们的生活,使过程更加简化,效率更高,这是我们之前无法想...
腾讯AI实验室推出GPT4Video:一种统一的多模态大型语言模型,用于指导跟踪理解和安全感知生成
“`html 解决视频理解和生成场景的问题,由腾讯AI实验室和悉尼大学的研究人员提出了GPT4Video。这个统一的多模型框架支...
谷歌AI研究呈现Translatotron 3:一种新颖的无监督语音到语音翻译架构
语音到语音翻译(S2ST)是一项破解语言障碍的变革性技术,但是平行语音数据的稀缺性阻碍了其进展。大多数现有模型需要监督设...
马克斯·普朗克研究人员推出PoseGPT:一种使用大型语言模型(LLMs)来理解和推理图像或文本描述中的3D人体姿势的人工智能框架
人的姿势对整体健康、幸福和生活的各个方面至关重要。它包括坐、站或躺时身体的对齐和定位。良好的姿势支持肌肉、关节和韧带...
关于小型语言模型(SLM)及其应用的一切你需要了解的事情
大型语言模型(LLMs),如GPT、PaLM、LLaMA等,因其令人难以置信的能力而受到广泛关注。它们利用自然语言处理、生成和理解的...
稳定性AI推出了SDXL Turbo 一款实时文本到图片生成模型
Stability AI推出SDXL Turbo,这是一种在文本到图像合成领域取得重大突破的创新蒸馏方法——敌对扩散蒸馏(ADD)。这一突破使得...
认识DreamSync:一种新的人工智能框架,通过从图像理解模型中获得反馈来改善文本到图像(T2I)合成
“`html 来自南加利福尼亚州大学、华盛顿大学、巴尔幸大学和谷歌研究的研究人员介绍了DreamSync,该技术解决了扩散型文...
高通AI研究的这篇AI论文揭示了EDGI:一种开创性的均匀扩散器,用于先进的基于模型的强化学习和高效规划
无处不在的对称性。物理学的普遍原则适用于空间和时间。当空间坐标被平移、旋转和时间平移时,它们表现出对称性。此外,如果...
ChatGPT 基础知识:你需要的数据科学备忘单
简介 欢迎来到数据科学的世界,算法、统计和领域专业技术融合在一起,从大型数据集中提取有意义的见解。在这个技术进步的时代...
DeepSeek公开源代码DeepSeek-67B模型:中国最新的ChatGPT竞争者
中国人工智能初创公司DeepSeek AI通过推出DeepSeek LLM系列开启了大型语言模型(LLMs)的新时代。由DeepSeek LLM 7B/67B Base...
CMU研究人员发现神经网络行为的关键洞见:重尾数据和网络深度在塑造优化动力学方面的相互作用
神经网络(NN)优化具有令人着迷的特性,这些特性无法用优化的经典工具轻易解释。研究团队对于每个特性的机械原因有不同程度...
这篇AI论文发布了对开源大规模语言模型的详细评价,这些模型声称在不同任务中赶超或超越了ChatGPT
“`html 去年ChatGPT的发布引起了人工智能界的轰动。基于GPT的Transformer架构,这是最新的大型语言模型,ChatGPT在学术...
- You may be interested
- Scikit-LLM:在scikit-learn框架内使用LLM...
- OpenAI和DeepMind与英国政府合作,推进人...
- 如何使用query()方法查询Pandas数据框?
- “无需重新培训即可改变模特的记忆形态”
- 这项人工智能研究解决了在持续学习环境中...
- 联邦政府告诉汽车制造商不要遵守马萨诸塞...
- 一个与微软押韵的案例
- “提升你的Python数据处理能力的2个任务”
- 学术合作伙伴如何帮助您验证初创企业的产品
- 介绍OpenChat:免费且简单的平台,可在几...
- 一个完整的音频数据集指南
- 自动化PDF预标签化以供亚马逊Comprehend使用
- 用定制镜头构建良好的 IDP 解决方案-可持...
- 思维链提示有助于提高LLMs的推理能力
- “加利福尼亚刚刚为自动驾驶汽车打开了闸门”