2023年8月的时间节点来看,Stable Diffusion依然是小众产品。
用具体的数字来衡量,假如国内ChatGPT的用户有1亿人,那么Midjourney的用户大约是GPT的十分之一,千万级的规模;而SD又是MJ的十分之一左右,也就是百万级。
而事实上,SD之所以最有可能成为新一代生产力工具,正是因为它有更强的可控性,即便Midjourney也难以望其项背。
而我要做的事,就是毫无保留的与各位分享实际案例和方法,希望有更多人看到SD的生产能力,进而有兴趣学习和使用。
这篇文章不会告诉你如何绘制更好看的小姐姐,相反,你可以从中学到一种新技能:即便足不出户,也能用Stable Diffusion绘制精美的电商产品图。
具体而言,你会看到这样的过程:
一个随手拍摄的咖啡杯
如何变成这样
这样
或者是这样
制作全流程都在这篇文章里,跟着做,你也能学会。
在开始之前,我们先捋一捋制作思路:
从一张真实产品图开始——分割背景和产品——替换背景——调整尺寸和文字
拍摄真实产品图
别看一些MJ教程中用提示词出产品图,绕不开的问题是随机性太大。如果你的商品已经是实物,毫无疑问,必然货要对板。
首先你要拍摄若干张实物图,拍摄设备并不需要太高要求,手机相机都可以,唯一的要求是光线充足,细节清晰,就像下面这样:
虽然照片中放置商品的盒子沾满猫毛,但这并不重要,它提供了一个简单有效的参照物,在后面的制作流程中能极大地减少我们的修正工作量。
照片的处理工作还没结束,手机拍摄的照片分辨率超过3K,这样的分辨率在Stable Diffusion中处理难度太大,电商平台的商品详情页并不需要如此高的分辨率,所以我们要预先调整照片尺寸。
以手机拍摄的3024x4032为例。如果你的设备显存高于16G,那么你可以缩减一半,改成1512x2016;如果你的设备显存低于16G,我建议你一步到位缩小3-4倍,改成1008x1344或者756x1008,先出图,再扩精度。
万物皆可SAM
如果你看过我之前写的文章,就不难理解我对Segment Anything有多推崇。技术进步带来的直观变化,就应当是任何人都可以学会的效率工具。
左键选择要保留的图形,右键选择不需要的图形,然后点击预览,前后不过一分钟的时间,蒙板就已经做好了。
这一步工作还没完,为什么现在市面上一些基于SD制作的电商图工具出图效果并不理想,正是因为它们忽略的商品的相对关系。如果做出来的商品图让人看着一眼假,谁又会相信产品详情页的描述货真价实呢?
接下来这一段是重点:
原图导入controlnet,选择预处理器softedge_hed得到预览图
下载预览图,然后修改成下面这个样子:
这样,你就得到了一个主要产品和次要背景之间直接联系,这能为你后面的出图和修改节约大量的时间。
万事俱备,开始替换背景。
局部重绘
主模型推荐realisticVision或者majicmixRealistic
正向提示词,重点描述产品背景
(best quality),(masterpiece), (photorealistic:1.3),extreme detail, product photo,raw photo, coffee_shop background, day time,warm light, no human,
反向提示词,常规的反向embedding
bad-picture-chill-75v BadDream badhandv4 EasyNegative FastNegativeV2 ng_deepnegative_v1_75t UnrealisticDream,(coffee cup:1.5),
参数设置如下图
重绘幅度可以多尝试几次,有时降低幅度反而会有更好的出图效果。
Controlnet设置平平无奇,没什么特别需要调整的地方。
直接出图:
实测1363x1817分辨率直出,显存峰值占用21.6GB,建议低于24G显存的用户出图分辨率不要超过1K。
跑出一张图之后,你就可以多抽几次背景,或者继续修改提示词尝试,再或者按照之前介绍的扩图方法延展画面,最后加上必要的文字,一系列咖啡杯广告图就做好了。不清楚的地方可以回看前几期文章,这里就不再累述。
有些时候我们不止要有产品,还需要个代言人,最好还是能指定性别、年龄、肤色的代言人,怎么办?
好办!如果你看过画手的那篇文章就不难理解:你需要的并不是一个代言人,而是一张拿着产品的人像照片。
流程如下:
拍摄真人产品图
叫上你的同事或者亲朋好友,性别年龄都不重要,重要的是摆出pose
再一次,万物皆可SAM
别忘了手部特写,值得单独做个softedge_hed
万事俱备,开始重绘
主模型推荐realisticVision和photon(欧美面孔)或者majicmixRealistic(亚洲面孔)
正向提示词:
Best quality,masterpiece,ultra high res,raw photo,deep shadow,dark theme,(photorealistic:1.4),(1man,smiling),(fashion clothes:1.2),inspired by brutalist architecture,vibrant color palette,undertones,hart hand, (london street),(standing in front of starbucks coffee shop:1.3),(sfw:1.1),good fingers,good logo,(starbucks logo:1.3)
反向提示词:
bad-picture-chill-75v,BadDream,badhandv4,EasyNegative,ng_deepnegative_v1_75t,exposed, (nsfw:1.1), many fingers, many hands, (nsfw:1.1)(tatoo)
设置参数跟上面的案例差不多,区别在于controlnet是这样的:
如果你不放心身体姿态,多加一个openpose也未尝不可:
直接出图:
还是那句话,只要你成功做出了一张图,你就已经做出了无数张图。重复这个工作流,你可以制作出任意姿势的真人产品图,一次性生成十几张,慢慢挑就行了。
既然你已经看到了这里,我建议你也动手试一试。创作的快乐,真的难以想象。
来源:林叔的呓语