stable diffusion中的 SadTalker 插件
只需要一张图片 一段语音就能够帮你制作会说话的数字人
会说话的数字人已经有很多软件可以制作 但是有使用次数限制 比如D-ID,Heygen
如果次数使用完后不想付费 那么stable diffusion的 SadTalker插件是个不错的选择
1.插件安装
安装过程会踩很多坑 建议先去b站看看 安装教程
https://github.com/Winfredy/SadTalker
2.SadTalker 使用参数:
1、上传人物照片。
2、上传语音文件。
3、选择视频人物的姿势:姿势变化种类。
4、分辨率:视频分辨率。
5、图片处理方法:corp是从图片截取头部做视频,resize 拉伸适合大头照或者证件照,full就是全身照做视频,extcorp 加强版裁剪主要聚焦头部,extfull加强版全身。
6、Still Model:让头部不要动作太大,以致偏离身体,负面效果是头不怎么动了。
7、GFPGAN:修脸,说话时嘴和眼的动作可能让脸有些变形,选上他让脸部好看一些 使得面部表情更加丰富。
Batch size in generation 同时处理数 约大处理越快但是也费显存 看gpu能力