Qwen-Image-Edit 是 Qwen-Image 的图像编辑版本,基于20B模型进一步训练,支持精准文字编辑和语义/外观双重编辑能力。
Qwen-Image-Edit 是 Qwen-Image 的图像编辑版本。它基于20B的Qwen-Image模型进一步训练,成功将Qwen-Image的文本渲染特色能力拓展到编辑任务上,以支持精准的文字编辑。此外,Qwen-Image-Edit将输入图像同时输入到Qwen2.5-VL(获取视觉语义控制)和VAE Encoder(获得视觉外观控制),以同时获得语义/外观双重编辑能力。模型特性特性包括:
- 精准文字编辑: Qwen-Image-Edit支持中英双语文字编辑,可以在保留文字大小/字体/风格的前提下,直接编辑图片中文字,进行增删改。
- 语义/外观 双重编辑: Qwen-Image-Edit不仅支持low-level的视觉外观编辑(例如风格迁移,增删改等),也支持high-level的视觉语义编辑(例如IP制作,物体旋转等)
- 强大的跨基准性能表现: 在多个公开基准测试中的评估表明,Qwen-Image-Edit 在编辑任务中均获得SOTA,是一个强大的图像生成基础模型。
官方链接:
ComfyOrg Qwen-Image-Edit 直播回放
Qwen-Image-Edit ComfyUI 原生工作流示例
请确保你的 ComfyUI 已经更新。工作流中的节点需要v0.3.50以上版本
本指南里的工作流可以在 ComfyUI 的工作流模板中找到。如果找不到,可能是 ComfyUI 没有更新。如果加载工作流时有节点缺失,可能原因有:
- 你用的不是最新开发版(nightly)。
- 你用的是稳定版或桌面版(没有包含最新的更新)。
- 启动时有些节点导入失败。
1. 工作流文件
更新 ComfyUI 后你可以从模板中找到工作流文件,或者将下面的工作流拖入 ComfyUI 中加载
下载 JSON 格式工作流下载下面的图片作为输入
2. 模型下载
所有模型都可在 Comfy-Org/Qwen-Image_ComfyUI 或 Comfy-Org/Qwen-Image-Edit_ComfyUI 找到Diffusion model
LoRA
Text encoder
VAE
Model Storage Location
📂 ComfyUI/
├── 📂 models/
│ ├── 📂 diffusion_models/
│ │ └── qwen_image_edit_fp8_e4m3fn.safetensors
│ ├── 📂 loras/
│ │ └── Qwen-Image-Lightning-4steps-V1.0.safetensors
│ ├── 📂 vae/
│ │ └── qwen_image_vae.safetensors
│ └── 📂 text_encoders/
│ └── qwen_2.5_vl_7b_fp8_scaled.safetensors
3. 按步骤完成工作流

- 模型加载
- 确保
Load Diffusion Model
节点加载了qwen_image_edit_fp8_e4m3fn.safetensors
- 确保
Load CLIP
节点中加载了qwen_2.5_vl_7b_fp8_scaled.safetensors
- 确保
Load VAE
节点中加载了qwen_image_vae.safetensors
- 确保
- 图片加载
- 确保
Load Image
节点中上传了用于编辑的图片
- 确保
- 提示词设置
- 在
CLIP Text Encoder
节点中设置好提示词
- 在
- Scale Image to Total Pixels 节点会将你输入图片缩放到总像素为 一百万像素,
- 主要是避免输入图片尺寸过大如 2048×2048 导致的输出图像质量损失问题
- 如果你很了解你输入的图片尺寸,你可以使用
Ctrl+B
绕过这个节点
- 如果你要使用 4 步 Lighting LoRA 来实现图片生成的提速,你可以选中
LoraLoaderModelOnly
节点,然后按Ctrl+B
启用该节点 - 对于 Ksampler 节点的
steps
和cfg
设置,我们在节点下方增加了一个笔记,你可以测试一下最佳的参数设置 - 点击
Queue
按钮,或者使用快捷键Ctrl(cmd) + Enter(回车)
来运行工作流
Paragoger衍生者AI训练营。发布者:arnehuo,转载请注明出处:https://www.shxcj.com/archives/10046