这是一篇为您准备的关于 Z-Image Turbo ControlNet 的详细安装与使用指南。鉴于“Z-Image ControlNet”最常见的情况是指 阿里通义实验室(Alibaba PAI) 最新发布的 Z-Image Turbo 模型及其配套的 ControlNet 功能,本指南将基于目前最主流的 ComfyUI 平台进行教学。
解锁 Z-Image ControlNet:从安装到精通的保姆级使用指南
前言:什么是 Z-Image Turbo?
你可能听说过 Stable Diffusion,也玩过 Flux,现在阿里通义实验室带来了 Z-Image Turbo。它是一个不仅生成速度极快(Turbo级别),而且在画质细腻度、双语(中英文)文本理解能力上都表现惊人的新模型。
更重要的是,它配套发布了 ControlNet Union 模型!这意味着你不需要下载十几个不同的 ControlNet 模型(什么 Canny、Depth、Pose 各一个),只需要一个模型文件,就能搞定边缘检测、深度图、姿势控制等多种功能。
本指南将手把手教你如何在本地电脑上部署并使用它。
第一阶段:环境准备
1. 硬件要求
- 显卡 (GPU): 推荐 NVIDIA 显卡。
- 8GB – 12GB 显存: 建议使用 FP8 版本的模型(性能损失极小,大幅节省显存)。
- 16GB – 24GB+ 显存: 可以尝试 BF16 原版模型。
- 内存 (RAM): 建议 16GB 以上。
- 硬盘空间: 预留约 20GB – 30GB 的 SSD 空间(模型文件比较大)。
2. 软件平台
- ComfyUI: 目前支持 Z-Image Turbo 最好的平台。如果你还没有安装,请去 Github 下载最新的便携版(Portable Version),解压即用。
- ComfyUI Manager: 必备插件管理器,用于安装缺失节点。
第二阶段:模型下载(保姆级路径指引)
你需要下载以下几个核心文件。请前往 Hugging Face 或国内的 Liblib/ModelScope 搜索相关模型名称。
1. 主模型 (Checkpoint)
目前推荐下载 All-in-One (AIO) 版本,它内置了 VAE 和 Text Encoder,使用最方便。
* 文件名示例: z-image-turbo-fp8-aio.safetensors (适合大多数人) 或 z_image_turbo_bf16.safetensors
* 存放路径: ComfyUI\models\checkpoints
2. ControlNet 模型 (核心!)
这是实现“精准控制”的关键。
* 模型名称: Z-Image-Turbo-Fun-Controlnet-Union
* 文件名示例: diffusion_pytorch_model.safetensors (下载后建议重命名为 Z-Image-Controlnet-Union.safetensors 以便识别)
* 存放路径: ComfyUI\models\controlnet
注意: 这是一个 Union (联合) 模型,意味着同一个文件可以支持 Canny (线条)、Depth (深度)、Pose (姿势) 等多种控制模式,非常强大!
第三阶段:ComfyUI 工作流搭建
打开 ComfyUI,我们开始搭建。为了方便,建议直接寻找现成的 Z-Image 工作流 JSON 文件拖入界面,但理解原理更重要:
1. 基础加载
- Load Checkpoint: 选择你下载的
z-image-turbo-fp8-aio。 - Clip Text Encode: 两个节点,一个连接 Positive (正向提示词),一个连接 Negative (负向提示词)。Z-Image 对中文提示词支持很好,你可以直接写中文!
- Empty Latent Image: 设置分辨率。推荐 1024×1024 或 768×1024。
2. 加入 ControlNet (关键步骤)
你需要添加 ControlNet 相关的节点栈:
1. Load ControlNet Model: 选择刚才下载的 Z-Image-Controlnet-Union。
2. Load Image: 上传你的参考图(比如一张线稿,或者一张人物照片)。
3. ControlNet Apply (Advanced) 或 ControlNet Apply:
* 将 control_net 连接到加载器。
* 将 image 连接到预处理器处理后的图像。
4. 预处理器 (Preprocessor): 这是最容易出错的地方!
* 因为使用的是 Union 模型,你需要根据你的需求选择辅助预处理器:
* 如果你想控制轮廓/线稿:添加 Canny 或 LineArt 预处理器节点。
* 如果你想控制姿势:添加 DWPose 或 OpenPose 预处理器节点。
* 如果你想控制景深/前后关系:添加 DepthAnything 预处理器节点。
* 连接顺序: 参考图 -> 预处理器 -> ControlNet Apply 节点。
3. 设置 Union 类型 (高阶技巧)
有些新的 Z-Image 专用 ControlNet 节点(通过 Update ComfyUI 获取)会有一个 type 选项。你需要手动指定你当前是在用什么功能:
* 选择 canny (如果你传的是线稿)
* 选择 pose (如果你传的是骨架图)
* 选择 depth (如果你传的是深度图)
* 如果不指定,模型通常也能泛化识别,但指定后效果更精准。
4. 采样与生成
- KSampler:
- Steps: 20 – 30 步足够。
- CFG: 3.5 – 5.0 (Z-Image 通常不需要太高的 CFG)。
- Sampler:
euler_ancestral或dpmpp_2m_sde。 - Scheduler:
karras或simple。
- VAE Decode: 连接并输出图像。
第四阶段:实战避坑与技巧
Q1: 报错 “Missing Nodes” 怎么办?
A: 打开右侧菜单的 Manager -> 点击 Install Missing Custom Nodes。它会自动检测你工作流里缺少的节点(通常是 ControlNet 预处理器或特定的 Z-Image 辅助节点)并安装。重启 ComfyUI 即可。
Q2: 生成出来的图控制效果很差?
A: 检查两点:
1. 预处理器对了吗? 比如你想提取线稿,必须先让图片经过 Canny 预处理器变成黑白线条图,再传给 ControlNet。不要直接把彩色原图传给 ControlNet 节点。
2. Control Strength (权重): 尝试调整权重。通常 0.8 – 1.0 是强控制。如果画面崩坏,降低到 0.6 试试。
Q3: 显存爆了 (OOM)?
A:
1. 确保你下载的是 FP8 版本的 Checkpoint。
2. 在启动脚本(run_nvidia_gpu.bat)里添加启动参数 --lowvram。
总结
Z-Image Turbo 的 ControlNet Union 极大地简化了以前繁琐的 ControlNet 流程。你不再需要根据不同的需求切换不同的 ControlNet 模型文件,“一模多用” 才是未来。
现在,去下载模型,找一张你喜欢的线稿,用中文写一句“在一个赛博朋克风格的城市里”,点击 Queue Prompt,见证奇迹吧!