Stable Diffusion的时尚二维码

使用Stable Diffusion和ControlNet创建了这张图片,并在Twitter和Instagram上分享了它——这是一幅既是插图又能作为可扫描的二维码的图像。

在这篇文章中,我想分享一些我学习过程中的见解以及我采用的方法来创建这个形象。此外,我想借此机会感谢那些使这个项目成为可能的出色工具和模型。

进入 Stable Diffusion

今年见证了令人难以置信的人工智能技术的爆炸式增长,例如ChatGPT、DALL-E、Midjourney、Stable Diffusion等等。作为一名曾经的摄影师,对设计和艺术也有一些兴趣,能够在几分钟内直接从想象中生成图像无疑是非常诱人的。

所以我开始尝试Midjourney,它非常易于使用,表现力很强,而且质量实际上相当不错。老实说,对于任何想要开始生成式人工智能艺术的人,这绝对是我的推荐。

QR码图像

几周前,Reddit上的一个用户发布了一系列使用Stable Diffusion和ControlNet创建的艺术二维码。这个概念让我着迷,我肯定想为自己制作一个。所以我进行了一些研究,并成功找到了原文《使用人工智能生成可扫描图像》。作者提供了他们的动机和训练模型的过程的见解,尽管他们没有发布模型本身。另一方面,他们正在建立一个名为QRBTF.AI的服务来生成这样的二维码,但目前尚不可用。

直到有一天,我在CivitAI上发现了一个社区模型QR Pattern Controlnet Model。我知道我必须试一试!

设置

我的目标是生成一个QR码图片,它能够指向我的网站,并展现出与我的兴趣相关的元素。最终,我选择了一个稍微带有密码朋克风格的设计,其中包含一个代表我自己的角色

免责声明:我绝对不是人工智能或相关领域的专家。在这篇文章中,我只是分享了我所学到的和我所遵循的过程。我的理解可能不完全准确,可能还有一些优化方法可以简化这个过程。如果您有任何建议或评论,请随时使用页面底部的链接与我联系。谢谢!

我基本上遵循了Stable DiffusionLoRA模型训练方法:一个完整的指南来安装web ui AUTOMATIC1111/stable-diffusion-webui,从CivitAI下载你感兴趣的模型等等。顺便说一下,我发现这个web ui的用户体验并不是非常友好,其中一些问题可能是一些架构问题,不容易改进,但幸运的是,我找到了一个相当不错的主题canisminor1990/sd-webui-kitchen-theme,它改进了许多小细节。

为了使用ControlNet,您还需要安装Mikubill/sd-webui-controlnet扩展程序以供Web UI使用。

然后您可以下载QR Pattern Controlnet模型,将两个文件( .safetensors 和 .yaml )放在 stable-diffusion-webui/models/ControlNext 文件夹下,并重新启动Web界面。

创建一个二维码

有数百个充斥着广告或收费服务的二维码生成器,但我们确实不需要那些花哨的东西——因为我们将使它变得更加花哨 😝!

所以我最终找到了QR码生成器库,一个开源QR码生成器的游乐场。它简单而正好符合我的需求!最好使用中等纠错级别或更高级别,以便后期更容易识别。一个小提示是,你可以尝试使用不同的掩模模式,以找到更好的颜色分布,以适应你的设计。

文字转图像

正如常规的Text2Image工作流程,我们需要为AI提供一些提示,以便生成图像。以下是我使用的提示:

Prompts 提示
(one male engineer), medium curly hair, from side, (mechanics), circuit board, steampunk, machine, studio, table, science fiction, high contrast, high key, cinematic light,
(masterpiece, top quality, best quality, official art, beautiful and aesthetic:1.3), extreme detailed, highest detailed, (ultra-detailed)
Negative Prompts负面提示
(worst quality, low quality:2), overexposure, watermark, text, easynegative, ugly, (blurry:2), bad_prompt,bad-artist, bad hand, ng_deepnegative_v1_75t
然后我们需要进入ControlNet部分,并上传我们之前生成的QR码图像。并根据模型主页上的建议配置参数。

然后你可以开始生成一些图像,看看是否符合你的期望。你还需要检查生成的图像是否可扫描,如果不能,你可以调整开始控制步骤和结束控制步骤,以找到风格化和二维码相似性之间的良好平衡。

阅读剩余
THE END