5分钟!菜鸟学会Stable Diffusion图生图功能

2023年 7月 11日 20.9k 0

本文默认你已经了解所有文生图的内容,因为图生图实际上是在文生图的基础上在加上原图作为一个输入变量,和文生图中的一些参数如正负tag、模型、lora等一起作为输入变量生成最后的结果,如果对文生图不了,可以参考之前的介绍文生图的章节。

其中和文生图一样的参数此处不再赘述,包括

  • 采样方法
  • 迭代步数
  • 面部修复
  • 可平埔
  • 宽度
  • 高度
  • 生成批次
  • 每批数量
  • 提示词相关性
  • 随机种子
  • 差异随机种子、差异强度等
  • 部分脚本X、Y、Z图表等

重绘幅度(Denosing strength)

图生图中最重要的参数即为重绘幅度,首先准备一个小姐姐,不输入任何正负tag,研究下重绘幅度的对图片的影响,参数如下图所示

5分钟!菜鸟学会Stable Diffusion图生图功能

结果如下所示,可以看到妹子开始卸妆,最后到0.6直接换了一个人,1.0直接和原图无关了。

5分钟!菜鸟学会Stable Diffusion图生图功能

我们不输入负向tag,在正向tag中输入Pikachu,可以看到前几张还算正常,0.8之后就直接变成皮卡丘了

5分钟!菜鸟学会Stable Diffusion图生图功能

重绘幅度很重要,值越大表示对原图重绘幅度越大,一些放大类的插件或脚本,重绘幅度不能设置太大,否则会生成非常奇怪的结果,比如一个人变成整张图都是人,这是放大器的工作原理有关系,后需来一篇专门讲如何放大发图片到2K、4K、8K

一般设置为0.75,这样图片会有较大的变化。

缩放模式(Resize mode)

缩放模式默认拉伸,缩放模式指的是当原图和要生成的图的宽和高不一致的时候,是需要按照什么方式缩放,一共包含四种模式

  • 拉伸
  • 裁剪
  • 填充
  • 拉伸(放大潜变量)

选中右上角的小笔可以自行调整输入的图片范围

5分钟!菜鸟学会Stable Diffusion图生图功能

因为我们原图是512x1024分辨率,我们设置目标分辨率为512x512尝试,去除所有正负tag,以全图作为输入,将重绘幅度设置为0,结果如下所示,下图从左往右依次是拉伸、裁剪、填充、拉伸(放大前潜变量)

5分钟!菜鸟学会Stable Diffusion图生图功能

可以看到缩放模式和重绘幅度对最终画面产生的影响,缩放模式在图片比例不一致时告诉AI该以什么比例去缩放,下面在看一个更加直接的例子加深理解,我们对下面这张方形图变成宽图512x512的分辨率变为860x460,注意此时要保留原图所有的正负tag,因为我们要加大重绘幅度这时候需要告诉AI重绘的部分以原图的tag进行,提示词相关性设置为5避免对原有人物产生过变化

5分钟!菜鸟学会Stable Diffusion图生图功能

首先重绘幅度设置为0看下原始的缩放模式在分辨率变化后产生的影响,下图从左往右分别是

  • 拉伸
  • 裁剪
  • 填充
  • 拉伸(放大潜变量)

5分钟!菜鸟学会Stable Diffusion图生图功能

绘图(Sketch)

绘图会把颜色信息带入,重绘幅度越低,颜色信息表现得越明显,另外绘图会将输入图片的所有部分继续重绘

比如给衣服换个颜色,注意如果正向tag中有和衣服颜色相关的可以先去掉,避免对结果产生影响

  • 提示词相关性7
  • 重绘幅度0.1,0.4,0.5,0.6,0.7,0.8,1.0

5分钟!菜鸟学会Stable Diffusion图生图功能

如下所示,可以看到重绘幅度在0.5以内符合蒙版的颜色

5分钟!菜鸟学会Stable Diffusion图生图功能

再比如,画个房子,当然在正向tag中也需要一些提示,比如

sun in sky,detail light,house,grass lawn ,forest ,river

5分钟!菜鸟学会Stable Diffusion图生图功能

重绘幅度分别设置为0.1,0.4,0.5,0.6,0.7,0.8,0.9,1.0

5分钟!菜鸟学会Stable Diffusion图生图功能

可以发现0.7的效果比较符合草图,也有较大的重绘效果,再以0.7画几张试试

5分钟!菜鸟学会Stable Diffusion图生图功能

另外我们发现0.6~0.7之间变化最大,因此尝试下重绘幅度在0.61~0.69的区别,发现在0.64到0.65之间画风突然转换

5分钟!菜鸟学会Stable Diffusion图生图功能

后续又再次尝试了很多次,最终没找到渐变的过程,都是重绘幅度在某个值突然画风转变,再次细分,尝试了很多次没有找到画风渐变的过程

5分钟!菜鸟学会Stable Diffusion图生图功能

下面展示下在这个过程中感觉还蛮不错的几张

5分钟!菜鸟学会Stable Diffusion图生图功能

局部重绘(Inpaint)

局部重绘没有颜色信息,仅仅只针对蒙版部分或者非蒙版部分继续绘制(可通过选项控制),其中会多出几个选项,如下所示

5分钟!菜鸟学会Stable Diffusion图生图功能

其中比较重要的

比如换个换装

  • 提示词相关性7
  • 重绘幅度0.1,0.4,0.5,0.6,0.7,0.8,1.0
  • 加上关键词(blue school uniform:1.4),(pink t-shirt:1.4)

5分钟!菜鸟学会Stable Diffusion图生图功能

下面看看结果

5分钟!菜鸟学会Stable Diffusion图生图功能

发现在重绘幅度在0.5的时候比较符合结果,再将重绘幅度设置为0.5多尝试几批次,看起来也只是像

5分钟!菜鸟学会Stable Diffusion图生图功能

重绘幅度设置为0.6在试试

5分钟!菜鸟学会Stable Diffusion图生图功能

重绘幅度选择0.6,重绘区域选择全图试试,似乎效果更好一些

5分钟!菜鸟学会Stable Diffusion图生图功能

重绘幅度选择0.6、重绘区域选择全图、蒙版蒙住内容选择填充

5分钟!菜鸟学会Stable Diffusion图生图功能

重绘幅度选择0.6、重绘区域选择全图、蒙版蒙住内容选择潜变量噪声

5分钟!菜鸟学会Stable Diffusion图生图功能

重绘幅度选择0.6、重绘区域选择全图、蒙版蒙住内容选择潜变量数值零

5分钟!菜鸟学会Stable Diffusion图生图功能

重绘幅度选择0.6、重绘区域选择全图、蒙版蒙住内容选择原图、蒙版模式选择重绘非蒙版内容,故名思意,就是衣服不换,其他全换。可以看到

5分钟!菜鸟学会Stable Diffusion图生图功能

局部重绘(手涂蒙版)(Inpaint sketch)

这就像是将绘图和局部重绘的结合版,即保留颜色信息也保留蒙版信息,和绘图(Sketch)的区别参考如下

What is the difference between Sketch and Inpaint Sketch Sketch tries to colour the masked zone by rendering the whole image. So in the final, you will have a totally new image (it can be very close to what you had initially). Usually, when you use Sketch, you want to use the same prompt as you had initially. Maybe, with some changes regarding your new colouring. Inpaint sketch rerenders only the masked zone, not touching the whole image. You can write a totally different prompt, and the inpaint will try to render your prompt in the masked area by using the colour you used. 原文:https://www.reddit.com/r/StableDiffusion/comments/10jqkd5/sketch_function_in_automatic1111/

Sketch是将颜色信息带入然后重绘整张图,通常需要将所有的正负tag信息带入,而Inpaint sketch只重绘被遮住的部分,不会重绘整张图,可以完全书写不一样的tag,然后会将颜色信息带入并且只重绘被遮住的部分

再来换个装

5分钟!菜鸟学会Stable Diffusion图生图功能

重绘幅度0.6,可以看到在一定程度上参考了我们的颜色信息,而且没有写任何提示词,使用局部重绘换装似乎更好用一些

5分钟!菜鸟学会Stable Diffusion图生图功能

下面按照重绘幅度0.1,0.4,0.5,0.6,0.7,0.8,1.0依次进行,结果如下,可以发现重绘幅度在0.4~0.6之间效果比较符合预期,重绘幅度太大AI就开始在蒙版里面放飞自我了

5分钟!菜鸟学会Stable Diffusion图生图功能

换个颜色在试试

5分钟!菜鸟学会Stable Diffusion图生图功能

其他参数和局部重绘类似,大家可以自行尝试

脚本-回送(Loopback)

将输出的图片继续当作输入生成图片,迭代次数即最终生成几张,每张的前一张作为本次的输入参数一直迭代

5分钟!菜鸟学会Stable Diffusion图生图功能

脚本-向外绘制(Outpainting mk2)

采样方法DPM++ SDE Karras、步数20、重绘幅度0.6、左边为原图,右边为左右外绘的图,虽然看起来不是很符合逻辑,但是一眼就能看出这个功能的含义了,就是向图像外进行绘制,如果边缘比较硬可以调高蒙版模糊像素试试

5分钟!菜鸟学会Stable Diffusion图生图功能

上面我们没有按照该脚本的推荐设置,下面我们按照推荐设置试试

  • 步数80
  • 采样方法Euler a
  • 重绘幅度0.8

5分钟!菜鸟学会Stable Diffusion图生图功能

脚本-效果稍差的向外绘制(Poor man`s outpainting)

参考向外绘制,这是一版过时的向外绘制,仔细看还是可以就看出边缘

5分钟!菜鸟学会Stable Diffusion图生图功能

脚本-使用SD放大(SD upscale)

关于放大在Stable Diffusion中有很多方法,后续会专门开一篇文章说明,此处简单描述,注意使用放大的时候重绘幅度要比较小,否则画面可能重绘幅度过大, 导致变化太多,重绘幅度太小可能导致没有添加足够多的细节,放大是在尺寸倍增的时候适当添加细节。

反推提示词

5分钟!菜鸟学会Stable Diffusion图生图功能

在顶部生成按钮的旁边有两个按钮,这两个按钮是用来反推提示词的,比如在随便一张照片,并不是AI生成自带提示词那种(AI生成的也可以),他会根据图片的内容用文本去描述图片,第一次点击会下载相关依赖,比较慢一点

  • CLIP反推,可以看到,描述还是比较准确的,衣服、颜色、背景都符合图像,CLIP反推一般是一句话描述

5分钟!菜鸟学会Stable Diffusion图生图功能

  • DeepBooru反推,结果也很准确,不过它的风格是关键词堆砌,很想我们在书写tag时的做法

5分钟!菜鸟学会Stable Diffusion图生图功能

相关文章

班迪录屏怎么取消截图水印设置
班迪录屏怎么改存储位置
bandicam录制的视频默认存储在哪
网易云音乐电脑怎么设置播放器样式
酷狗音乐如何创建歌单
酷狗音乐如何单曲循环播放

发布评论