Stable Diffusion超分放大:高清修复(Hires.Fix)篇

2023年 7月 11日 24.7k 0

图片均为  视频中测试生成的图像。

由于专栏对上传图像大小的限制,无法上传大小超过 20MB 的 PNG 原图,所以我只能将 PNG 转成 JPG再上传。

Latent(两次线性)(2x放大)

跑图显卡:A10(性能介于 RTX A5000 和 RTX 3090之间)

原图尺寸:512 x 832

超分放大后尺寸:1024 x 1664

单张图耗时:约 20s

Stable Diffusion超分放大:高清修复(Hires.Fix)篇Latent(两次线性)(2x放大)

可以看到,Latent 放大算法在低重绘幅度下,生成的图像是模糊的。

在该例子中:

的图像开始可用,前提是你喜欢这种朦胧感。

的图像的超分放大效果较好。

的图像,背景仍然存在模糊感

的图像,背景开始发生变化(左侧的树枝变成一堆绿叶)。

从开始,画面内容出现较大变化。

的图像背景与前面的图像相比发生了较大的变化。另外,右侧底部的手也出现了问题。

的的图像不仅背景有较大变化,人物的服装也发生较大变化。

和的图像,直接古神化。

Latent(两次线性)(4x放大)

跑图显卡:A10(性能介于 RTX A5000 和 RTX 3090之间)

原图尺寸:512 x 832

超分放大后尺寸:2048 x 3328

单张图耗时:约 4min

Stable Diffusion超分放大:高清修复(Hires.Fix)篇Latent(两次线性)(4x放大)

可以看到,4x放大的效果无论在那个重绘幅度下都挺差的。

在该例子中:

之前的图像都是模糊的。

~的图像虽然不模糊,但画面是扭曲的。

的图像,背景仍然存在模糊感。

的图像,背景开始发生变化(左侧的树枝变成一堆绿叶)。

从开始,画面直接放飞自我,直通古神。

R-ESRGAN 4x+ (2x放大)

跑图显卡:A10(性能介于 RTX A5000 和 RTX 3090之间)

原图尺寸:512 x 832

超分放大后尺寸:1024 x 1664

单张图耗时:约 20s

Stable Diffusion超分放大:高清修复(Hires.Fix)篇R-ESRGAN 4x+ (2x放大)

在该例子中:

0~的图像都比较正常。

当重绘幅度为0时,相当于用后期处理直接进行超分放大。

从开始,画面内容出现变化。

和的图像,背景发生变化。

的图像,背景和人物服装都发生了变化。

和的图像,直接古神化。

R-ESRGAN 4x+ (4x放大)

跑图显卡:A10(性能介于 RTX A5000 和 RTX 3090之间)

原图尺寸:512 x 832

超分放大后尺寸:2048 x 3328

单张图耗时:约 4min

Stable Diffusion超分放大:高清修复(Hires.Fix)篇R-ESRGAN 4x+ (4x放大)

与 Latent 放大算法的情况不同,R-ESRGAN 4x+ 放大算法在低重绘幅度下的图还是可以用的。

在该例子中:

0~的图像效果还是可以接受的。

当重绘幅度为0时,相当于用后期处理直接进行超分放大。

从的图像开始,画面背景逐渐变模糊。

的图像,右侧底部的手出现了问题。

的图像,手臂直接变成了头发。

从的图像开始,画面逐渐古神化。

Latent(nearest)与 Latent(nearest-exact)

2x放大

原图尺寸:512 x 832

超分放大后尺寸:1024 x 1664

Stable Diffusion超分放大:高清修复(Hires.Fix)篇Latent(nearest)& Latent(nearest-exact) 2x放大

当放大倍数为整数倍时,两个 Latent 放大算法的区别不大。

放大

原图尺寸:512 x 832

超分放大后尺寸:768 x 1248

Stable Diffusion超分放大:高清修复(Hires.Fix)篇Latent(nearest)& Latent(nearest-exact) 放大

当放大倍数不是整数时,两个 Latent 放大算法的区别就展现出来了。

可对比两张图像的以下部分:

头顶的蝴蝶结、刘海、眼睛、耳环、脖子上的饰品、裙子的装饰以及裙摆的装饰等。

另外,用 Latent(nearest)放大算法生成的图像,女孩的左肩位置存在类似头发的伪影。

相关文章

班迪录屏怎么取消截图水印设置
班迪录屏怎么改存储位置
bandicam录制的视频默认存储在哪
网易云音乐电脑怎么设置播放器样式
酷狗音乐如何创建歌单
酷狗音乐如何单曲循环播放

发布评论