摆脱限制:MoMA对机器幻觉的验证
Breaking Free MoMA's Validation of Machine Illusions
自1929年以来,纽约市现代艺术博物馆(MoMA)一直是艺术爱好者的圣地。这是一座灯塔,为先锋派绘画和雕塑照亮道路,而“现代艺术”的定义始终在变化中,它的收藏也是如此。现在,这个杰出的机构正在验证数字艺术。
作为 Refik Anadol Studio(RAS)的首席数据科学家,我很高兴看到我们的作品“Unsupervised”被MoMA接受。
在RAS,我们向大众展示数据美学,显示出人工智能的潜力不仅限于文本生成。我们希望看到我们的艺术对各个年龄和背景的人们产生情感上的影响。这是一种共同的人类体验,也是一种高度可接触的体验。
由 gottalovenewyork 在 YouTube 上拍摄的“Unsupervised”
当然,AI生成的艺术并不是没有争议的。最普遍的误解之一是,数字艺术总体上,特别是AI生成的艺术并不是合法的艺术品。然而,即使是AI生成的艺术也不完全是由机器创作的。它需要人类的触摸。作为“Unsupervised”背后的远见者,Anadol从原始数据中创作艺术。这在数字艺术中是新的。在他之前的艺术家使用数据遵循模板产生已经存在的事物的复制品。Refik的作品完全不同。
想象机器的幻觉
在RAS,我领导着一个由七位数据科学家组成的团队。我的日常工作包括监督、审核和编写代码,以及与客户直接沟通和项目规划。这可能看起来不太艺术,但迄今为止,我已经收集了超过30亿张图片,用作AI生成艺术的燃料。鉴于我的日常工作充满了编码和数据集的细节,退一步看看RAS所创造的整体作品,会给人一种惊艳的体验。
让我带你体验一下“Unsupervised”的感觉。想象一下:你走进MoMA的大厅。一开始,它看起来似乎是走进了任何其他艺术博物馆。但是,如果你四处看看,你会突然被这个巨大的屏幕(24英尺乘24英尺)所震撼,周围坐着和站着的人们都在凝视着展品。
展品本身不断移动。它不断变化,展示迷人的颜色和形状。你所看到的取决于你在进入MoMA时遇到的展览章节,以及大厅的实时音频、动作跟踪和天气数据。
Christian Burke站在MoMA的展品前
“Unsupervised”试图回答这个问题:“如果一台机器能够亲自体验MoMA的收藏,它会梦见或产生什么幻觉?”通过将MoMA所有收藏的数据结合起来,形成这些机器梦境,“Unsupervised”带领观众穿越艺术的历史,并将聚光灯投射到艺术的潜在未来。
艺术有时努力表达更广泛的社会问题。如果你从“Unsupervised”中得到一个总结,那就是这个展览标志着AI生成数字艺术合法化的一个转折点。对于艺术世界来说,MoMA就像核聚变对于物理学家来说是一种圣杯。MoMA选择展示这种关于计算机如何处理数据、如何“思考”、创造和产生幻觉的探索,为Anadol和其他数字艺术家提供了验证。
但并不是每个参观“Unsupervised”的人都一定在思考机器和它们的梦境。当你走进MoMA的大厅时,你会看到各种各样的人类群体——从小孩子四处奔跑到年长者和各行各业的人——都在享受这种强烈的共同体验。对我来说,看着人们观看展品和观众本身一样令人兴奋。我见过人们哭泣,见过他们表达喜悦和爱意。虽然我自己不是艺术家,但我相信它具有治愈的特质。我也相信,无论人们在任何地方做什么,只要你足够关注做好某件事,就能在其中发现艺术。
人类与人工智能之间的合作伙伴关系
人类艺术家需要掌握技术技能来创作艺术作品。他们需要理解诸如色调价值再现、透视、对称甚至人体解剖等方面的知识。《无监督》通过在人类与人工智能之间建立合作伙伴关系,将艺术的技术性推向了一个巨大的飞跃。
RAS公司利用现代艺术博物馆超过18万件艺术作品的数据创建了《无监督》。沃霍尔、毕加索、博乔尼等艺术家的作品以及Pac-Man的图像都被输入到软件中。然后我们创建了各种人工智能模型,并进行了大量测试。在选择最佳模型后,我们对其进行训练,让它不仅能综合吸收输入的所有艺术作品,还能创造出与众不同的作品。
《无监督》不仅仅是其各个部分的总和;它是全新的。由于我们的艺术处理,展览所创造的一切都是独一无二的。
人类与机器之间的合作需要在硬件和软件两方面进行创新。我们的团队在创建所需的神经网络和使展览能够根据环境因素实时改变图像方面面临了许多挑战。
其中一个挑战是分辨率。如果您在Stable Diffusion中输入提示,通常会得到512×512像素的分辨率。我们使用的人工智能基础——Nvidia的StyleGAN——通常提供1024×1024的分辨率。《无监督》的分辨率是3840×3960,可能是合成图像的神经网络中最高的分辨率。当您走进现代艺术博物馆大厅并看到《无监督》时,您会明白高分辨率的重要性。它让艺术作品栩栩如生,几乎可以从屏幕上跳出来。
实时性是另一个重要的挑战。《无监督》以流体般的液态流动产生其机器幻觉和梦境。这些机器幻觉来自于超过18万件艺术品的综合,同时考虑实时因素。
离现代艺术博物馆不远的一座建筑拥有一个收集与天气相关的数据的气象站。我们将这些数据输入到《无监督》中,这意味着无论天气是多云、晴朗、多雨还是有雾,机器都会将室外的氛围融入到室内的展示中。
其次,展览还会融入来自观众自身的实时数据。大厅天花板上的摄像头会向机器提供有关访客数量和动作的数据。然后,机器在显示其艺术梦境时会考虑这些数据。
有一个古老的问题:生活是否比艺术更多地模仿艺术?对于《无监督》来说,答案显然是两者都有。
观众在观看展览时会被其展示所触动,而他们自己也会影响《无监督》的外观。
由Irma Zandl在YouTube上拍摄的《无监督》在现代艺术博物馆的画面
类似地,人工智能与人类之间的合作伙伴关系也是双向的。可以说,数字艺术将传统艺术过程中添加了一些额外的技术技能。然而,我更愿意将其看作是互惠互利。
数字艺术确实需要在艺术过程中添加一些技术工具,例如扩散模型和提示工程。另一方面,人工智能本身消除了进入艺术世界所需的一些障碍。假设我喜欢绘画,但是我画人物画很差。人工智能可以通过解决我的技术限制来弥合这个差距。
人工智能的未来
由于广受欢迎,《无监督》在现代艺术博物馆多次延长展期,机器幻觉可能会无限延续。展望未来,我希望看到人工智能生成的数字艺术得到更大程度的认可。模型将继续改进,希望技术能够更加普及,让每个人都能够使用。
人工智能可以通过提高可访问性来使艺术世界实现民主化,但目前仍存在技术壁垒。我希望能看到更简单、更直观的界面中可用的人工智能工具,这可以降低技术知识的门槛。我们目前在RAS正在进行的新项目之一是集成到网络中的工具,可以让人们更轻松地使用和互动人工智能。这是我们在RAS的主要目标:为与人工智能的更多互动创造条件。
由于《非监督》需要人的大量参与才能创作,有人问我是否认为人工智能将永远需要人的参与。至少目前来说,答案绝对是肯定的。人工智能在许多方面都很出色,比如合成,但在大规模工程和创新方面缺乏能力。
人工智能生成的艺术可能看起来很有创意,但人工智能本身并不创造。实际上,它与创造相反。如果我们想要继续前进并在人工智能和技术的发展中取得进步,我们需要依靠自己,而不是机器。
作者注:MoMA提供了Refik Anadol Studio(RAS)使用他们的训练数据的权限。
Christian Burke负责Refik Anadol Studio的数据科学团队,包括人工智能、机器学习、Web和Web3开发。
您可以在Twitter和LinkedIn上关注Christian。