2D资产生成:游戏开发中的人工智能 #4
'2D资产生成:游戏开发中的人工智能 #4' can be translated as '2D asset generation AI in game development #4'.
欢迎来到游戏开发中的人工智能!在这个系列中,我们将使用人工智能工具在短短5天内创建一个完全功能的农场游戏。在这个系列结束时,你将学会如何将各种人工智能工具融入到你的游戏开发流程中。我将向你展示如何使用人工智能工具来进行以下方面的开发:
- 艺术风格
- 游戏设计
- 3D资源
- 2D资源
- 故事
想要快速的视频版本吗?你可以在这里观看。否则,如果你想要技术细节,请继续阅读!
注意:本教程适用于熟悉Unity开发和C#的读者。如果你对这些技术还不熟悉,建议在继续之前先查看Unity初学者系列。
第四天:2D资源
在本教程系列的第三部分中,我们讨论了文本到3D还不够完善。但对于2D来说情况就大不相同了。
在这一部分中,我们将讨论如何使用人工智能来生成2D资源。
前言
本教程描述了一种协作生成2D资源的过程,其中将稳定扩散作为传统2D工作流程中的一个工具。这适用于一些具有图像编辑和2D资源创建知识的读者,但对于初学者和专家来说也可能有所帮助。
要求:
- 你偏好的图像编辑软件,比如Photoshop或GIMP(免费)。
- 稳定扩散。有关设置稳定扩散的说明,请参考第一部分。
图像到图像
像稳定扩散这样的扩散模型通过由文本引导的噪声重建图像。图像到图像使用相同的过程,但以真实图像作为输入而不是噪声。这意味着输出的图像在某种程度上会与输入图像相似。
图像到图像中的一个重要参数是降噪强度。这控制了模型改变输入的程度。降噪强度为0将完全复制输入图像,而降噪强度为1将生成一个非常不同的图像。降噪强度还可以被视为创造力。下面的图片展示了在各种降噪强度下,使用一个圆形输入图像和“月亮”提示进行图像到图像处理的结果。
图像到图像允许将稳定扩散作为一个工具使用,而不是传统艺术工作流程的替代品。也就是说,你可以将自己手工制作的资源传递给图像到图像,通过手工迭代结果,等等。让我们以农场游戏为例。
示例:玉米
在这一部分中,我将介绍如何为农场游戏生成一个玉米图标。作为起点,我勾画了一个非常粗略的玉米图标,用于布局图像的构图。
接下来,我使用图像到图像工具生成了一些图标,使用以下提示:
玉米、james gilleard、atey ghailan、pixar概念艺术家、stardew valley、动物之森
我使用了降噪强度为0.8,以鼓励模型更具创造力。生成了几次后,我找到了一个我喜欢的结果。
图片并不需要完美,只需要朝着你想要的方向前进,因为我们将不断迭代。在我这个例子中,我喜欢产生的风格,但觉得茎太复杂了一些。所以,我在Photoshop中进行了一些修改。
注意,我粗略地涂改了我想要改变的部分,让稳定扩散填充了细节。我将修改后的图像再次放入图像到图像工具中,这次使用了较低的降噪强度0.6,因为我不想偏离太远的输入。这样生成了一个我几乎满意的图标。
玉米茎的底部对我来说有些画得太艺术了,而且顶部还有一个新芽。所以,我在Photoshop中对这些部分进行了涂改,然后在Stable Diffusion中再次进行了一次处理,并去除了背景。
瞧,一个准备好的农场游戏玉米图标,不到10分钟就完成了。但是你也可以花更多时间来得到更好的结果。我推荐观看这个视频,以获取制作更复杂资产的更详细的步骤。
示例:镰刀
在许多情况下,你可能需要稍微努力才能获得你想要的结果。对我来说,这对于镰刀图标来说绝对是这种情况,需要进行大量的迭代才能达到我想要的方向。
问题很可能在于网上有更多关于镰刀作为武器而不是农具的图片。一个解决办法是进行提示工程,即调整提示以使其朝着正确的方向前进,比如在提示中写上镰刀、镰刀工具或在负面提示中写上武器。然而,这并不是唯一的解决办法。
Dreambooth、文本反转和LoRA是定制扩散模型的技术,使其能够生成更符合你要求的结果。虽然这些超出了本教程的范围,但值得一提,因为它们在2D资产生成领域中越来越突出。
类似layer.ai和scenario.gg的生成服务专门针对游戏资产生成,可能使用了Dreambooth和文本反转等技术,使游戏开发者能够生成风格一致的资产。然而,目前还不清楚哪种方法将在新兴的生成式游戏开发工具中占据主导地位。
如果你对这些高级工作流程感兴趣,可以查看这篇博客文章和Dreambooth培训空间。
点击这里阅读第5部分,我们将使用AI进行故事创作。