Midjourney 终于在昨天上线了版本,新版本的模型可控性上了一个台阶,同时还增加画面扩展等令人激动的新功能。粒子狗我也率先体验了一把,接下来给大家细说。
更新重点:
· 新增支持了类似PS AI的画面扩展功能
· 有更准确的提示词理解,效果更明显的风格化(Stylize)参数
· 增加了提示词精简功能(shorten)
的激活方式
按照官方文档的说法,现在默认的模型已经是,也就是在不加任何参数的情况下,就是激活模型了。当然你也可以自己手动添加参数“--v 5.2”来指定模型。或者通过/settings的指令来指定版本。
/settings界面
重磅:新增的zoom out功能
这个可以认为是类似于PS AI画面补全或者SD里面的outpaint(画面扩展)功能。当你点击upscaler拿到大图之后,会出现zoom out的相关菜单:
Zoom Out一般中文翻译成缩小,他的工作模式也是如此,先进行缩小,再将多出来的部分补全。比如选择Zoom Out 2x,就是将原画面(1024x1024)缩小成1/2(512x512),然后将周边因为缩小而多出来的部分补全变成新的画面(1024x1024)。
想要自己定制补充画面的提示词,指定Zoom out的倍数,或者定义新的图片比例,可以点击Custom Zoom。
比如我想要狗狗在天上飞,修改一下提示词:
这时候生成的结果就变成了:
或者,我也可以将图片修改为3:1的比例,在左右两边扩展画面,给他增加两个同伴。(这个时候要注意,--zoom要设成1,因为我们只是想扩展画面,并不想让原画面缩小):
然后就出来了可爱的单身狗三兄弟:
生成图片的尺寸为1904x640,总像素数跟1024x1024相若。
另外,如果原图片是非1:1的尺寸的话,下面还会多出来一个make square的按钮。
他的功能是将画面直接补全成1:1比例,跟使用“--zoom 1 --ar 1:1”的效果是一样的。
当然,我们还可以继续无限扩展,具体就看你的想象力了。
提示词准确性提升
之前发现Midjourney在提示词比较简单的时候,会混入一些莫名其妙的元素。比如当我使用模型尝试去画一只狗的时候:
生成结果
(把铲屎官也加进来了还不止,给我整只一人高的赤丸是想怎样……)
同样的提示词和种子,就没有这个问题
生成结果
而且,同样也是可以用raw风格的~
风格化(stylize)参数效果更明显
之前也发现,里面,“--s”这个参数超过了100就基本上没啥变化了。按道理,应该s越高,Midjourney越会根据美学自由发挥的。
的变化更明显,s越高之后,添加的细节更多
Vary(变化)增加了strong(强烈)和subtle(轻微)的选项
这个是用来控制生成图像变体的时候,变化的强弱。
要使用这个选项有两种方法,一种是通过/settings来设置:
其中的High Variation Mode对应的就是strong,Low Variation Mode对应的就是subtle。
另外当你点击upscaler放大图像之后,也会出现相应的选项。
(另外提一嘴,现在midjourney原始就是直接生成大图的,upscaler只是把这张图调出来,不会像以前那样消耗算力,大家尽情点就好)
可以发现,strong的情况下画面变化更大。平时建议大家设成strong,毕竟用Vary也主要是想出个不同的版本嘛。
加入了提示词精简(shorten)的功能
以前看那些动不动就一两百个单词的提示词模版,总觉得很玄学,到底哪些有用哪些没用。现在有了/shorten功能,就可以一窥这个黑匣子里面大概是怎么运作的。比如我想画一张弹吉他少女的照片,我使用shorten处理以下提示词:
他会给我输出结果:
他帮我划掉了一些词,还给了我几个选项,越到后面的选项就越精简。如果点击“Show Details”按钮,还能获取到每个词所占的权重:
可以看到,排在越前面的提示词权重确实是越大的。我选精简后的第一项跟我原本的提示词同时生成来对比一下:
生成结果的感觉也是大差不差,这把奥卡姆剃刀还是挺实用的。
总体来说,这次midjourney的更新虽小,但很实用,可控性大大增加。