Stable Diffusion 3 Medium 正式开源

运维资讯 2024-06-13 大猫手机阅读

Stability AI 宣布 Stable Diffusion 3 Medium 现已开源，是 Stable Diffusion 3 系列中最新、最先进的文本生成图像 AI 模型——官方声称是“迄今为止最先进的开源模型”，其性能甚至超过了 Midjourney 6。

根据介绍，Stable Diffusion 3 Medium模型规格参数达到了20亿，可以给用户带来更真实的图片体验。目前用户可以从Hugging Face上下载该模型。

SD3 Medium 可以根据用户输入的文本描述，重点克服了文生图模型中手部和脸部的挑战，生成足以乱真的的图像。SD3 Medium 还利用其底层的 Diffusion Transformer 架构，高精度地整合了文字元素。

Stable Diffusion 3 Medium 正式开源-每日运维

SD3 Medium 的另一个特点是易于使用。相比较一些资源密集型 AI 模型，SD3 Medium 可以在消费级显卡上运行，可以加速普及适配。

Stability AI 表示，Stable Diffusion 3 Medium代表了生成式人工智能发展的一个重要里程碑，并延续了Stability AI致力于使这项强大技术民主化的承诺。