“生成模型与噪声与结构的舞蹈”
模型与噪音结构的华美舞蹈 (Móxíng yǔ zhāoyīn jiégòu de huá měi wǔdǎo)
构建数字梦想家的指南
我喜欢思考文艺复兴时期的意大利居民,对人类想象力和理性的可能性充满热情。他们对我们现代科技的可能会感到最惊讶的是什么呢?
梦想飞行器的达·芬奇在看到空中巨无霸380飞机在空中翱翔时,肯定会感到印象深刻。乘客们舒适地斜靠在座椅上,观看电影,抱怨Wi-Fi速度不够快。
但在中世纪看来,生成式AI技术可能是最具魔力的技术之一。达·芬奇辛勤劳作多年,绘制《蒙娜丽莎》的肖像画,如果我向他展示一个能以他的风格在几秒钟内绘制一位女性肖像的装置,他会说什么呢?瞧:

确实,这位女性的微笑并不如真正的蒙娜丽莎那样诱人和神秘(仔细观察后,看起来有些荒谬),但我们中的许多人都遇到了人工智能生成的令人惊讶的实例:从超现实的图像到酷似真人的语音深度伪造,甚至整篇由人工智能编写的文章。
生成式AI模型就像是硅基材料的梦想家:它们可以从虚无中构想出某物,从噪音中找到意义。它们已经学会了舞蹈,有序和无序相互交织。它们已经改变了我们对人类创造力的思考方式,并打开了成千上万种新应用的大门,威胁着整个行业并创造新的行业。
我们才刚刚开始,大多数这些模型还处于初级阶段。有了ChatGPT的文本、DALL-E和Midjourney的图像,以及最近的音乐生成模型,如Stability AI的StableAudio,我们正在进入一个时代,在这个时代,我们每天向大脑输入的感觉信号中有越来越多的信号在某种程度上被AI改变或完全生成。
在本文中,我想揭开这个神奇的黑匣子的盖子,深入探讨…



