重要GAN模型及应用概述

关于重要的GAN模型及其应用的概述

生成对抗网络(GANs)自从2014年推出以来,已经彻底改变了图像合成的方式。本文概述了一些最具影响力的GAN模型,用于关键的计算机视觉应用,如文本到图像生成、图像到图像的翻译和图像超分辨率。

GANs的工作方式是通过训练两个神经网络 —— 生成器和判别器 —— 在一个对抗性的游戏中,输出与真实图像无法区分的合成图像。

第一部分描述了StackGAN,一种开创性的文本到图像GAN,它使用两个阶段的过程来从文本描述中生成高分辨率、照片逼真的图像。

接下来,将研究Pix2Pix GANs用于不同领域的图像到图像翻译的通用任务。Pix2Pix引入了在生成器上对输入图像进行条件设定,以学习领域特定的损失函数的概念。最后一部分介绍了SRGAN,它专门用于将低分辨率图像提升到高定义版本。

你是否打算开始从事数据科学和人工智能的职业,并需要学习如何做到?我提供数据科学辅导课程和长期职业辅导:

订阅我的新闻通讯《To Data & Beyond》,获取我的文章的完整和提前访问:

To Data & Beyond | Youssef Hosni | Substack

数据科学、机器学习、人工智能以及它们之外的内容。点击阅读《To Data & Beyond》,由Youssef Hosni编写的……

youssefh.substack.com

1. 文本到照片合成

从文本描述中合成高质量图像是计算机视觉中的一个具有挑战性的问题。现有的文本到图像方法生成的样本可以粗略地反映……