创业公司 Stability AI 宣布释出开源文本图像模型 Stable Diffusion 的 v2.0 版本。
新特性包括:
用全新文本编码器 OpenCLI 训练的文本图像模型,比 1.0 版本显著改进了生成图像的质量,模型现在能以默认分辨率 512×512 和 768×768 生成图像;Upscaler Diffusion 模型增强了图像分辨率,系统现在能生成 2048×2048 或更高分辨率的图像;新模型 depth2img 能推断输入图像的深度,能利用深度信息生成新图像;等等。