AI图像生成工具
2023年,是AI文生图领域高歌猛进的一年。但目前来看,AI生成的图像仍存在一些局限有待进一步突破,例如在细节、精度方面不足,多数情况下仍存在画面瑕疵、缺陷,光影、色调的调整更依赖后期人工处理等等。
Midjourney
Midjourney作为文生图领域的开拓者和领导者,其生成的图片质量一直是行业标杆。
2022年,一张用Midjourney生成的图像在科罗拉多州博览会数字艺术竞赛中获得第一名,引发了大众对于AI绘画和Midjourney的关注。
目前,Midjourney已更新至V6版本,生成的图像质量逐步提高,功能也越来越多元、完善。
最初,Midjourney搭载在Discord上,用户只能通过向其官方Discord服务器上的Discord机器人发送消息来访问。
2023年12月13日,Midjourney上线了网页版,但使用门槛是用Midjourney生成了超一万张图(可以在Discord里输入“/info”,查看生成的图片数量)。相较于Discord,网页版Midjourney操作更简便,但功能少很多。
Stable Diffusion
Stable Diffusion是一款基于扩散模型的AI绘画工具,由Stability AI公司研发,能够完成文生图和图生图等任务,于2022年8月22日发布。
Stable Diffusion是一个完全开源的项目,包括模型代码、训练数据、论文等,这使得其快速构建了强大繁荣的上下游生态,比如AI绘画社区Civitai、基于SD的自训练模型,以及丰富的辅助AI绘画工具与插件等。
2023年6月,Stable Diffusion发布了SDXL 0.9版本的更新,升级了Stable Diffusion文生图模型。
2023年11月29日,Stability AI发布了新一代文生图模型SDXL Turbo,将生成图像所需的步骤数从50步减少到1步,并且大幅提升了推理速度,可以做到实时生成图像。在A100上,SDXL Turbo可以在207毫秒内生成一幅512x512的图像。
不过,Stable Diffusion的安装和使用对硬件有较高要求。
DALL·E 3
DALL·E 3是OpenAI于2023年9月21日发布的图像生成模型,于2023年10月初向ChatGPT Plus和Enterprise客户提供。
DALL·E 3的最大特点是与ChatGPT的集成,它原生构建在ChatGPT之上,通过ChatGPT来创建、拓展和优化prompt。当用户输入一个想法时,ChatGPT会自动为DALL·E 3生成量身定制的、详细的prompt,同时用户也可以使用自己的prompt。
这种集成使得DALL·E 3具备更强的理解能力,能够更好地理解和处理抽象冗长的提示,使用户更轻松地将自己的想法转化为准确的图像。
Adobe Firefly
Adobe Firefly,也被称为“萤火虫”,是一款由Adobe开发的Web应用程序,它的发布标志着Adobe在人工智能和AI绘图领域的一次重要突破。
主要AI功能包括文本生成图像和生成式填充,用户可以通过简单的文本提示进行描述,移除图像的一部分、向图像添加其他内容,或替换为所生成的内容。
此外,Adobe Firefly还支持在Creative Cloud应用程序中使用简单的文本提示,拓展了应用程序工作流程和生成式AI结合的可能性。
Leonardo AI
Leonardo是一个AI绘画社区,同时也是一个AI绘画工具。
Leonardo深度集成了Stable Diffusion的各种插件,比如ControlNET的openpose姿势参考、局部重绘、prompt提示等等,甚至还提供了傻瓜式在线训练模型的功能,这使Leonardo更像是Stable Diffusion模型分享社区Civitai(civitai.com)和Stable Diffusion的集合体。
来源:头号AI玩家