“生成模型与噪声与结构的舞蹈”

模型与噪音结构的华美舞蹈 (Móxíng yǔ zhāoyīn jiégòu de huá měi wǔdǎo)

构建数字梦想家的指南

我喜欢思考文艺复兴时期的意大利居民，对人类想象力和理性的可能性充满热情。他们对我们现代科技的可能会感到最惊讶的是什么呢？

梦想飞行器的达·芬奇在看到空中巨无霸380飞机在空中翱翔时，肯定会感到印象深刻。乘客们舒适地斜靠在座椅上，观看电影，抱怨Wi-Fi速度不够快。

但在中世纪看来，生成式AI技术可能是最具魔力的技术之一。达·芬奇辛勤劳作多年，绘制《蒙娜丽莎》的肖像画，如果我向他展示一个能以他的风格在几秒钟内绘制一位女性肖像的装置，他会说什么呢？瞧：

确实，这位女性的微笑并不如真正的蒙娜丽莎那样诱人和神秘（仔细观察后，看起来有些荒谬），但我们中的许多人都遇到了人工智能生成的令人惊讶的实例：从超现实的图像到酷似真人的语音深度伪造，甚至整篇由人工智能编写的文章。

生成式AI模型就像是硅基材料的梦想家：它们可以从虚无中构想出某物，从噪音中找到意义。它们已经学会了舞蹈，有序和无序相互交织。它们已经改变了我们对人类创造力的思考方式，并打开了成千上万种新应用的大门，威胁着整个行业并创造新的行业。

我们才刚刚开始，大多数这些模型还处于初级阶段。有了ChatGPT的文本、DALL-E和Midjourney的图像，以及最近的音乐生成模型，如Stability AI的StableAudio，我们正在进入一个时代，在这个时代，我们每天向大脑输入的感觉信号中有越来越多的信号在某种程度上被AI改变或完全生成。

<img alt="“一个驻扎在画架前的画家，画布的左侧是一片混乱的噪音，逐渐转变成一座有结构、美丽的数字化城市。艺术风格应该半真实半超现实。灯光柔和而散射，创造一种梦幻般的氛围。”Chat-GPT提供提示，DALL-E完成绘制。

在本文中，我想揭开这个神奇的黑匣子的盖子，深入探讨…

“生成模型与噪声与结构的舞蹈”

模型与噪音结构的华美舞蹈 (Móxíng yǔ zhāoyīn jiégòu de huá měi wǔdǎo)

构建数字梦想家的指南

DETR（目标检测的变压器）

“渐变是什么，为什么它们会爆炸？”

关于Qwen大型语言模型（LLM）系列的一切你需要...

旅途中 V5：Midjourney 的最新版本

用生成式人工智能中的先进变压器开启创造力

清华大学和微软研究员推出ToRA：一种用于数学...

介绍HNSW：分层导航小世界

PPO与剪辑如何配合工作？

人工智能