我们如何生成一个从未见过的新概念?特拉维夫大学的研究人员提出了ConceptLab:利用扩散先验约束进行创造性生成
特拉维夫大学的研究人员提出了ConceptLab,用于创造性生成从未见过的新概念
人工智能领域的最新发展已经为各种用例提供了解决方案。不同的文本到图像生成模型为一个令人兴奋的新领域铺平了道路,其中书面文字可以转化为生动、引人入胜的视觉表达。通过个性化技术的爆炸性增长,概念化独特想法的能力在新环境中得到进一步扩展。已经开发了许多算法来模拟创造性行为或旨在增强和增加人类创造过程。
研究人员一直在努力找出如何利用这些技术来创造全新和富有创意的概念。为此,最近一篇研究论文中,研究团队在创造性文本到图像生成领域引入了概念实验室。该领域的基本目标是提供符合广泛分类的新鲜示例。考虑到开发一种与我们习惯的所有品种都截然不同的新品种的挑战,扩散先验模型是这项研究的主要工具。
这种方法从基于令牌的个性化中汲取灵感,即使用令牌来表达独特概念的预训练生成模型的文本编码器。由于没有预先的所需主题的照片,创造新概念比使用传统的反演技术更加困难。为了解决这个问题,在优化过程中使用了CLIP视觉语言模型进行指导。这些限制存在着积极和消极的方面;消极的限制涵盖了生成应该偏离的现有类别成员,而积极的约束则促进了与广泛类别相一致的图像的发展。
作者展示了如何将创建真正原创内容的困难有效地表达为在扩散先验输出空间上发生的优化过程。优化过程的结果是他们所称的先验约束。研究人员将一个问答模型纳入框架中,以确保生成的概念不仅仅会收敛于现有的类别成员。这个自适应模型对于优化过程至关重要,它会反复添加新的限制。
这些额外的限制指导了优化过程,鼓励它寻找越来越独特和独特的发明。由于这个系统的自适应性质,模型逐渐探索了想象力的未知领域,鼓励模型推动其创造性极限。作者还强调了所提出的先前限制的适应性。除了使创建独立的原创概念更容易外,它们还充当了强大的混合机制。混合概念的能力允许创建生成概念的创造性融合。这种额外的适应性增强了创造过程,并产生了更加有趣和多样化的结果。
总之,本研究的主要目标是通过结合当代文本到图像生成模型、未经研究的扩散先验模型和由问答模型驱动的自适应约束扩展机制,开发出独特和富有创意的概念。结果是一个全面的策略,产生原创、引人注目的内容,并鼓励对创意空间进行流畅的探索。