《DALL·E2的哲学和艺术观点》

DALL·E2's philosophy and artistic perspectives

简介：探索人工智能和艺术的交叉点：关于将DALL·E2融入创作过程的智力对话

感谢Yaron Senderowicz教授和Liav Isaac Shopen愿意接受采访并为这篇博文贡献自己的见解。

介绍和动机

DALL·E2已经发布一段时间了，我觉得从哲学和艺术的角度来写一篇博文可能会很有趣。作为一名数据科学家和业余版画家，我对了解这种方法在艺术上的视角和应用方式感到好奇。

虽然工程师经常专注于使事物正常工作，但值得更多地关注其他方面，比如艺术、审美和社会考虑，这些方面通常得到的关注较少。这次探索的主要动机是更好地理解和探索DALL·E2在艺术上的意义和具有人类特点的地方。换句话说，我们应该如何解释DALL·E2的输出？

此外，人们越来越关注DALL·E2及其对就业的影响。它生成的图像非常吸引人，以至于很难分辨它们是由人还是算法生成的。例如，我们刚刚目睹了一张由人工智能生成的照片获得了摄影奖，凸显了这个问题的重要性。

在本博文中，我有幸采访了两位引人注目的人物。第一位采访者是Yaron Senderowicz教授，他是特拉维夫大学哲学教授，以其对人类意识的研究而闻名。第二位采访者是版画大师Liav Isaac Shopen，他的艺术造诣和实践经验使他对DALL·E2以及如何将其融入自己的艺术作品有着独特的理解。

与Yaron Senderowicz教授的访谈

Ido：Yaron，你能分享一下你对DALL·E2的看法吗？你是否认为这个算法在某些方面不仅可以模仿人类能力，还可以展示人类能力？

我并不完全清楚这个算法是否真正复制了人类的能力。例如，人类可以自动创作艺术作品，但关键问题是这些艺术作品是否具有审美价值。可以制定标准来确定一件艺术作品是否具有这种价值。我认为一个标准是艺术作品对环境的敏感程度。

我们存在于一定的文化、时代、空间和文明中。我们可以很容易地辨别不同文化之间的差异。例如，如果莫扎特的作品在12世纪或21世纪呈现，它的审美价值可能会有显著差异，因为它与产生它的环境有着固有的联系。

创造力、意义和环境

Ido：创造力涉及意义和人类对其的感知。那么，艺术家的作品应该如何解释和评估？

Yaron：技术可以复制梵高的风格，但我们应该质疑自己，我们使用DALL·E2创作的艺术作品是否提供了新的东西，还是仅仅是现有作品的衍生物。如果你有技术资源完美地复制梵高的艺术风格，并不意味着创造出来的作品就是艺术。它只是展示了令人印象深刻的模仿能力。

了解DALL·E2的一种可能方法是使用“字面意义”的概念。人类有能力判断一种语言使用是否正确，即使它没有被明确定义或其真实条件没有被明确说明。约翰·西尔（John Searle）是一位美国哲学家，他以对语言哲学的贡献而闻名，他对“字面意义”的概念提出了质疑（即一种对句子的直接和直接解释，没有任何比喻或隐喻的元素）。

意义的概念与环境有着内在的联系。问题在于是否可能提供包括某个术语应用于世界对象的必要和充分条件的描述。此外，我们是否能够准确理解定义（或计算机也是如此），以便在我们既没有考虑过也没有遇到过的交谈环境中，正确地应用或使用这个术语。

尽管我们的词汇和我们使用该词的程度是有限的，但我们能够理解一句话。基于记忆使用该词的实例是明确和有限的。现在，举个例子来说明这一点，我们来看一下文章标题为“字面含义”的概念“在”的定义。让我们考虑一个我们想要理解的短语——“猫在地毯上”，或者“猫在地板上”。

有没有一种准确推断出在适当情况下将这些术语与猫和地毯相关联所需的语义上的必要和充分条件的方法？要肯定地说一只猫在地毯上，必须有多少部分在地毯上？我们如何定义这一部分？一只腿？三只腿？如果两只腿在地毯上，两只腿离开地毯呢？

我们能否准确确定何时正确地说猫在地毯上？让我们进一步说明。想象一下在太空中飞行，你看到一只猫和一块地毯倒置放置。猫看起来是倒立的，但谁在上面？意识到我们在使用“在”的时候，我们假设了一个背景——地球的重力。这种无意识的使用只是说明了我们的陈述和对陈述和术语的理解都潜在地依赖于背景，而这个背景从未被明确陈述或完全阐明。

为了更精确地描述背景，考虑另一种情景，你去美国旅行。你在沙漠中感到饥饿，于是在一家餐馆停下来，点了一杯可乐和一份汉堡。突然间，你得到了一份5米长的汉堡和一杯2米高的可乐。这是你点的东西吗？可能不是，但你是如何在点单时说明这一点的呢？任何理解背景的人——“购买汉堡是什么意思”——都知道这不是你点的东西。而这个背景在不同的文化中显然是不同的。

你可能会说这不是你点的东西，但无法充分描述无数可能的情况。我们总是在特定背景下理解。

人类与算法的创造力

Ido: 你对人类与算法的创造力有什么看法？

Yaron: 将这个讨论与创造力联系起来——人类的创造力表现在能够理解一个缺乏具体定义的术语的创造性用法上。然而，任何熟练掌握该语言的人要么会同意这种新的应用是正确的，要么会否定这种应用。不过，总会有一些人持不同意见。在这里，没有精确定义的东西，而要做到这一点需要更丰富的逻辑系统。

我主要的观点是，我们应该始终质疑那些相信自己发现了一个算法的人，尤其是与艺术相关的算法：他们是否只是产生了一个成功模仿以前创作的风格或作品的算法？只有当我们展示了一台能够创造艺术新动向的计算机，或者写一本新书时，我们才能回答这个问题。

毕加索是一位出色的具象艺术家，在探索其他风格之前，常常教授这种风格。艺术在历史上是分层的，要求理解其根源和基础。当计算机成功地在艺术中引发了新的动向——也就是说，当评论家或专家惊叹地说：“哇！我们以前从未见过这样的东西”——如果这个动向真正源于对艺术历史状态的理解，适当地融入其中，并引发了一种变革，那就是重要的。当这种情况发生时，并且它成功地创作了重新定义了诗歌本身理解方式的诗歌，正如博尔赫斯所说——在卡夫卡的作品之后，人们突然发现了许多已存在的卡夫卡。

模仿者 vs 创新者

Ido: 对于模仿者与创新者的问题有何看法？

Yaron: 模仿者和创造者之间无疑存在着对比。人们可以欣赏艺术品中的创造力和独创性。

许多这些算法的开发者可能会争辩说，没有普遍接受的创新。他们可能认为这太模糊或无法定义。诚然，艺术一直在不断地进行辩论。然而，在今天的世界中，学者们引用现代文本可以将其与非现代文本区分开来。诠释学（解释理论）就关注这个问题。这是任何试图解释文本之间的意义的人的关键问题。他们专门处理这种类型的问题，努力解决源于事物的文化背景的历史性特征。

为了真正成为我们生活经验的一部分并对其做出重要贡献，计算机必须从单纯的模仿者发展为创新者和创造者。它应该力求产生新的东西，而不仅仅是复制别人已经发明的东西。我并不是说这样的算法不存在，但我们应该谨慎地断言它的存在。我想说的是，测试的重点不在于能否复制或伪造别人的绘画风格，而在于能否引起新的文化转变。

一个真正有创造力的计算机应该能够生成一个新的流派。立体派绘画的出现最初被视为是对传统艺术的贬低。直到我们对莫奈、马奈和雷诺阿这些印象派艺术家的作品进行审美调整之后，我们才回顾性地欣赏到印象派的痕迹一直延续到18世纪。突然之间，它弥漫了公共领域。创新的演变可以用一个隐喻来类比；它开始时是一种令人耳目一新和意料之外的东西，随着时间的推移，它获得了一个更具体、更明确的意义。

这种演变总是与特定的时间、政治、社会和文化背景以及我们对过去的解读方式有关。这是一个复杂的过程，不能仅仅通过提取梵高用来绘画的规则的软件来描绘。绘画行为远远超出了这个范畴。梵高的作品是一个具体的个体创造的具体行为，他超越了现有的规范进行创新。

我们需要区分技术成就和创造力。我们需要调查创造力如何在我们所知的人类生活中出现，然后评估算法输出是否与之相匹配。

访谈2 —— 李亚夫·伊萨赫·肖本，一位大师级刻版艺术家

伊多：李亚夫，您对DALL·E2有何看法，以及我们应该如何采用这种技术？

李亚夫：我认为DALL·E2应该被视为一种工具，而不是艺术过程的替代品。从一个初始的想法开始，构思一个提示，然后看看结果是否能启发您。对我来说，DALL·E2似乎是您心中概念的一种过滤器。您可以通过使用提示的产品作为视觉参考来丰富您的艺术品。关键是在实验所提供的图像上注入您独特的艺术风格。我会不断地对其进行修改，不断寻求与我创造的原始图像的变体。随着这个过程的重复，艺术品会变得更加准确，并生成与我的风格相符的新图像。

与其在Pinterest或其他平台上搜索，不如使用DALL·E2来根据自己的艺术偏好定制结果。在这方面，我认为它可以取代传统的艺术平台，为艺术家提供个性化的参考。

伊多：有人可能会争论说，这种技术产生的结果如此美丽，以至于只有人类才能创造出来。您对此有何看法？

李亚夫：有些结果确实非常出色，但它们仍然感觉有些冷漠和疏离。在某些方面，这项技术使艺术家重新获得了对他们的创造的控制权，因为他们必须提取他们想要创造的参考，而这并不总是容易做到的。然而，重要的是要注意，这个参考并不是最终的产品，而是艺术过程中的一个中间阶段。

伊多：您如何将DALL·E2用于自己的目的？

基于我生成的一幅图像，我创作了一幅黑白凹版印刷作品。我准备了一个关于我寻求的精确描述，这个主题帮助我构思了一个与我通常的作品不同的图像。最终，每个艺术家都有一套主题，这个工具可以帮助扩展这个范围。我不确定如果没有DALL·E2，最终的作品是否会是我的首选，但它确实使开发过程更快速、更多样化。

伊多：是什么促使您从一开始就使用DALL·E2？

李亚夫：这部分是由于围绕这个工具的热议，以及我对其对我的创作过程的潜在贡献的好奇心。对我来说，这与被它的能力所打动不同，更多的是关于如何使用它并将其融入我的工作中。DALL·E2通过包括金融、时间和努力的便利性等方面使艺术更加易于接触，这与当前的DIY运动潮流相吻合。

仅仅使用它并不能使您成为一位艺术家。我认为仅仅生成一幅图像并不能使其具备艺术的标签，还需要额外的个人层面或阶段。

Ido：这次对话回溯到我与Yaron的采访 —— 这是否代表创造力？是否模仿了人类的某个方面？

Liav：我认为艺术作品必须具备独创性，以在过去的创作基础上，在特定的背景和语境中进行创作。目前，我们正在使用其他人创建的语言，并对其进行变体。作为艺术家，我们的角色是贡献自己的观点，从而将创造力还给艺术家，并产生新颖性。就审美吸引力而言，我认为这取决于个人偏好。我们最终必须质疑自己是否对最终产品感到亲近。虽然我认为创造力是人类固有的，但我们无法将如何衡量创造力应用于计算机。人类经常将人类特征投射到非人类事物上，但这些不应被误认为是现实。

Ido：所以你的意思是将DALL·E2视为类似人类能力的想法源于我们的世界观？

完全正确。这是一个常见的现象。以抽象绘画为例，每个观众都会看到略有不同的东西。我们投射我们熟悉的，我们渴望的东西。这是人类的一部分。要有效地使用DALL·E2，您必须投入创作过程并引导算法，尤其是在尝试捕捉更抽象的感觉或氛围时。

结论和主要要点

艺术本质上涉及独创性、发明性、好奇心和文化背景的概念。我们应该问自己的根本问题在于我们与所使用的AI工具的关系。我们仅仅是使用它们来创建输出，还是真正融入我们独特而个性化的触感来真实地表达自己？

就我看来，主要要点是：

(1) 尽管像DALL·E2这样的算法具有模仿人类艺术风格的卓越能力，但关键是要质疑它们是否真正展现了人类创造力的新颖和独特品质。

(2) 艺术中的真正创新需要具备生成新的流派和引发文化转变的能力，而不仅仅是对现有风格的复制。

(3) DALL·E2应被视为增强艺术过程的工具，而不是完全替代它。它可以用作视觉参考点和思想过滤器，使艺术家能够将自己独特的风格注入到由AI生成的图像中。

(4) 人类倾向于将人类特征投射到非人类事物（如DALL·E2）上，不应被误认为是现实。

参考文献

Searle, J. R. (1978). Literal meaning. Erkenntnis, 207–224.

Art,DALLE-2,Data Science,Generative Art,Philosophy

《DALL·E2的哲学和艺术观点》

DALL·E2's philosophy and artistic perspectives

简介：探索人工智能和艺术的交叉点：关于将DALL·E2融入创作过程的智力对话

介绍和动机

与Yaron Senderowicz教授的访谈

访谈2 —— 李亚夫·伊萨赫·肖本，一位大师级刻版艺术家

新的技术深入课程：AWS上的生成式人工智能基础

如何从任何PDF和图像中提取文本以供大型语言模型使用

机器人感知和运动的算法

计算机辅助证明应用于流体流动

能源取证中的先进AI算法开发：通过消费模式对...

“犯罪分子使用WormGPT（暗网的ChatGPT）的四种...

如何使用OpenAI的函数调用

这份AI通讯简报是你所需要的 #57

人工智能