Nunchaku FLUX.1-dev高算力适配指南：Blackwell显卡FP4模型部署

本文介绍了如何在星图GPU平台上自动化部署Nunchaku FLUX.1-dev文生图镜像，以适配Blackwell架构显卡。该平台简化了复杂AI模型的部署流程，用户可快速搭建环境，并利用该镜像的核心功能，轻松生成高质量、细节丰富的AI图片，适用于创意设计、内容创作等场景。

南风寺山

247人浏览 · 2026-03-05 05:16:42

南风寺山 · 2026-03-05 05:16:42 发布

Nunchaku FLUX.1-dev高算力适配指南：Blackwell显卡FP4模型部署

如果你手头有一块最新的Blackwell架构显卡，比如RTX 50系列，想体验一下当前最前沿的文生图模型，那么Nunchaku FLUX.1-dev绝对值得一试。这个模型在图像生成的质量和细节上表现非常出色，但它的部署过程对新手来说可能有点复杂。

别担心，这篇指南就是为你准备的。我会带你一步步完成从环境准备到最终生成图片的全过程，特别是针对Blackwell显卡的FP4量化模型部署。整个过程就像搭积木，只要跟着步骤走，你也能在自己的电脑上跑起来。

1. 开始前的准备工作

在动手安装之前，我们需要确保你的电脑环境已经就绪。这就像盖房子前要打好地基一样重要。

1.1 硬件要求

首先说说硬件，这是决定你能跑什么版本模型的关键：

显卡：必须是支持CUDA的NVIDIA显卡。如果你想用FP4量化版本来适配Blackwell显卡，那么RTX 50系列是最佳选择。其他NVIDIA显卡也可以，但需要用INT4版本。
显存：建议24GB以上。如果显存不够，后面我会告诉你怎么选择占用更少的版本。
内存：至少16GB，32GB会更流畅。
存储空间：准备50GB以上的空闲空间，用来存放模型文件。

1.2 软件环境

软件方面需要准备这几样：

Python 3.10或更高版本：这是运行ComfyUI的基础。
Git：用来下载代码和插件。
PyTorch：需要安装与你的系统和显卡匹配的版本。如果你是Blackwell显卡，需要torch 2.7/2.8/2.9这些较新的版本。

安装这些基础工具的命令很简单：

# 安装Python（如果还没安装）
# 可以从python官网下载安装包

# 安装Git
# Windows用户可以从git-scm.com下载安装

# 安装PyTorch（以CUDA 12.1为例）
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121

1.3 必备工具

还有一个工具需要提前安装，就是huggingface_hub。这个工具能帮你从网上下载模型文件，后面会用到。

安装命令：

pip install --upgrade huggingface_hub

好了，基础环境准备好了，接下来我们进入正题。

2. 安装Nunchaku ComfyUI插件

ComfyUI是一个可视化的AI工作流工具，而Nunchaku是专门为FLUX模型优化的插件。我们需要先安装ComfyUI，再装上Nunchaku插件。

2.1 安装ComfyUI-nunchaku插件

这里有两种安装方法，你可以选一个觉得方便的。

方法一：用Comfy-CLI安装（最简单）

如果你喜欢命令行操作，这个方法最省事：

# 先安装ComfyUI的命令行工具
pip install comfy-cli

# 安装ComfyUI本体（如果已经安装过可以跳过）
comfy install

# 安装Nunchaku插件
comfy noderegistry-install ComfyUI-nunchaku

# 把插件移动到正确的位置
mv ComfyUI-nunchaku ComfyUI/custom_nodes/nunchaku_nodes

这个方法会自动处理依赖关系，适合不想折腾的用户。

方法二：手动安装（更灵活）

如果你想自己控制安装过程，或者遇到网络问题，可以试试手动安装：

# 1. 下载ComfyUI的代码
git clone https://github.com/comfyanonymous/ComfyUI.git
cd ComfyUI

# 2. 安装Python依赖包
pip install -r requirements.txt

# 3. 进入自定义节点目录
cd custom_nodes

# 4. 下载Nunchaku插件
git clone https://github.com/mit-han-lab/ComfyUI-nunchaku nunchaku_nodes

手动安装的好处是你可以看到每一步发生了什么，有问题也容易排查。

2.2 安装Nunchaku后端

插件装好了，还需要安装后端支持。从v0.3.2版本开始，这个过程变得很简单。

安装完插件后，Nunchaku会提供一个install_wheel.json文件。你只需要在ComfyUI的网页界面里加载这个工作流文件，它就会自动安装或更新所需的后端组件。

如果自动安装不成功，你也可以手动安装：

# 进入插件目录
cd ComfyUI/custom_nodes/nunchaku_nodes

# 安装Python依赖
pip install -r requirements.txt

3. 准备Nunchaku FLUX.1-dev模型

插件安装好了，接下来要准备模型文件。这是最关键的一步，文件放错位置或者版本选错了，后面就跑不起来了。

3.1 配置工作流文件

首先，我们需要把Nunchaku自带的工作流示例复制到ComfyUI能识别的位置：

# 进入ComfyUI的根目录
cd ComfyUI

# 创建用户工作流目录（如果不存在的话）
mkdir -p user/default/example_workflows

# 复制示例工作流
cp custom_nodes/nunchaku_nodes/example_workflows/* user/default/example_workflows/

这些工作流文件相当于预设好的“配方”，告诉ComfyUI怎么使用FLUX.1-dev模型来生成图片。

3.2 下载模型文件

现在要下载模型文件了。FLUX.1-dev需要几个不同的组件，就像做菜需要主料和调料一样。

基础FLUX模型（必须下载）

这部分包括文本编码器和VAE模型，它们负责理解你的文字描述和最终生成图片。

下载文本编码器：

# 下载CLIP文本编码器
hf download comfyanonymous/flux_text_encoders clip_l.safetensors --local-dir models/text_encoders

# 下载T5文本编码器
hf download comfyanonymous/flux_text_encoders t5xxl_fp16.safetensors --local-dir models/text_encoders

下载VAE模型：

# 下载VAE模型
hf download black-forest-labs/FLUX.1-schnell ae.safetensors --local-dir models/vae

如果你已经通过其他方式下载了这些模型，也可以创建软链接来使用：

# 查看文本编码器目录
~/ComfyUI/models$ ls -l text_encoders/
total 0
lrwxrwxrwx. 1 root root 68  2月 25 00:47 clip_l.safetensors -> /root/.cache/huggingface/FLUX.1-dev/text_encoders/clip_l.safetensors
lrwxrwxrwx. 1 root root 72  2月 25 00:47 t5xxl_fp16.safetensors -> /root/.cache/huggingface/FLUX.1-dev/text_encoders/t5xxl_fp16.safetensors

# 查看VAE目录
~/ComfyUI/models$ ls -l vae
total 0
lrwxrwxrwx. 1 root root 54  2月 25 00:48 ae.safetensors -> /root/.cache/huggingface/FLUX.1-dev/vae/ae.safetensors

Nunchaku FLUX.1-dev主模型（核心）

这是最重要的部分，不同的显卡需要下载不同的版本：

Blackwell显卡（如RTX 50系列）：使用FP4模型
其他NVIDIA显卡：使用INT4模型
显存不足的情况：可以选择FP8量化版

对于大多数用户，INT4版本是个不错的选择，它在效果和速度之间取得了很好的平衡：

# 下载INT4版本的主模型
hf download nunchaku-tech/nunchaku-flux.1-dev svdq-int4_r32-flux.1-dev.safetensors --local-dir models/unet/

下载后，模型应该放在models/unet/目录下。你可以检查一下：

~/ComfyUI/models$ ls -l unet/
total 0
lrwxrwxrwx. 1 root root 72  2月 25 00:50 svdq-int4_r32-flux.1-dev.safetensors -> /root/ai-models/comfyanonymous/unet/svdq-int4_r32-flux.1-dev.safetensors

可选LoRA模型（提升效果）

LoRA就像给模型加的“滤镜”或“风格包”，可以让生成的图片有特定的风格或效果。

常用的LoRA有：

FLUX.1-Turbo-Alpha：加速生成，减少推理步数
Ghibsky Illustration：宫崎骏动画风格

下载后放在models/loras/目录：

~/ComfyUI/models$ ls -l loras/
total 0
lrwxrwxrwx. 1 root root 76  1月 27 18:47 diffusion_pytorch_model.safetensors -> /root/ai-models/comfyanonymous/diffusion/diffusion_pytorch_model.safetensors
lrwxrwxrwx. 1 root root 55  1月 27 18:46 lora_v2.safetensors -> /root/ai-models/comfyanonymous/lora/lora_v2.safetensors

4. 启动ComfyUI并生成图片

所有准备工作都完成了，现在可以启动ComfyUI开始生成图片了。

4.1 启动ComfyUI

在ComfyUI的根目录下，运行这个命令：

python main.py

启动成功后，你会看到类似这样的输出：

Starting server
To see the GUI go to: http://127.0.0.1:8188

用浏览器打开这个地址（通常是http://127.0.0.1:8188），就能看到ComfyUI的界面了。

4.2 加载Nunchaku工作流

进入ComfyUI网页界面后，点击右上角的“Load”按钮，然后选择我们之前复制的工作流文件。

对于文生图任务，我推荐使用nunchaku-flux.1-dev.json这个工作流。它支持加载多个LoRA，生成效果最好。

Nunchaku FLUX.1-dev工作流界面

工作流加载后，你会看到界面上有很多节点和连接线。别担心，大部分设置已经配好了，你只需要关注几个关键参数。

4.3 设置参数并生成图片

现在到了最有趣的部分——生成图片。

首先找到提示词输入框（通常标着“Prompt”），在这里输入你想要生成的图片描述。FLUX模型对英文提示词支持更好，所以建议用英文描述。

举个例子，你可以输入：

A beautiful landscape with mountains and lakes, ultra HD, realistic, 8K
（美丽的山水风景，超高清，写实风格，8K分辨率）

提示词输入示例

然后调整一些关键参数：

推理步数（Steps）：一般20-30步效果就不错了，步数越多细节越好但时间越长
分辨率：默认是1024x1024，如果显存不够可以降到768x768
LoRA权重：如果用了LoRA，可以调整它的影响强度，一般0.5-1.0之间
采样器（Sampler）：默认的DPM++ 2M Karras就不错

设置好后，点击界面上的“Queue Prompt”按钮，ComfyUI就会开始生成图片了。第一次运行可能会慢一些，因为要加载模型。

等待一会儿，你就能在右侧的预览区看到生成的图片了。

生成结果预览

如果对效果不满意，可以调整提示词或者参数再试一次。生成图片就像拍照，多试几次总能找到最满意的角度和光线。

5. 需要注意的关键事项

在使用的过程中，有几个地方需要特别注意，能帮你避免很多麻烦。

5.1 模型文件存放位置

这是最容易出错的地方，文件放错了位置ComfyUI就找不到模型：

主模型：必须放在models/unet/目录下
LoRA模型：放在models/loras/目录
文本编码器：放在models/text_encoders/目录
VAE模型：放在models/vae/目录

记得检查一下每个目录里都有对应的文件，文件名也要正确。

5.2 显存适配选择

不同的模型版本对显存的要求差别很大：

FP16原版：需要约33GB显存，适合高端显卡
FP8量化版：需要约17GB显存，中等配置可以考虑
INT4/FP4量化版：显存占用最低，大多数显卡都能跑

如果你的显存不够，生成时可能会报“CUDA out of memory”错误。这时候可以：

降低生成图片的分辨率
使用量化版本模型
关闭一些占用显存的功能

5.3 显卡兼容性

不同架构的显卡对模型格式的支持不一样：

Blackwell显卡（RTX 50系列）：只能用FP4格式的模型
其他NVIDIA显卡：优先用INT4格式，兼容性最好
AMD显卡：目前支持有限，可能需要额外配置

如果你不确定自己的显卡该用什么版本，可以先试试INT4，如果不行再换其他版本。

5.4 工作流依赖问题

有时候加载工作流会提示缺少节点，这通常是因为没安装对应的自定义节点。

解决方法很简单：

在ComfyUI界面找到“Manager”菜单
点击“Install Missing Custom Nodes”
等待安装完成，然后重启ComfyUI

5.5 推理步数设置

这里有个重要的细节：如果你关闭了FLUX.1-Turbo-Alpha这个LoRA，那么推理步数不能少于20步。

为什么？因为这个LoRA能加速生成过程，如果不用它，就需要更多的步数来保证图片质量。步数太少的话，生成的图片可能会模糊或者缺少细节。

6. 总结与下一步建议

到这里，你已经成功在ComfyUI中部署并运行了Nunchaku FLUX.1-dev模型。整个过程虽然步骤不少，但每一步都有明确的目标。我们来回顾一下关键点：

首先，确保你的硬件和软件环境符合要求，特别是Blackwell显卡要选择FP4模型版本。然后按照顺序安装ComfyUI和Nunchaku插件，下载所需的模型文件并放到正确的位置。最后启动ComfyUI，加载工作流，输入提示词就能生成图片了。

如果你第一次运行就成功了，恭喜你！如果遇到问题，别着急，AI部署本来就是个调试的过程。常见的问题无非是模型文件放错了位置、显存不够、或者依赖包没装全。按照错误提示一步步排查，通常都能解决。

学会了基础用法后，你可以尝试更多有趣的玩法：

混合使用不同的LoRA，创造独特的风格
调整各种采样参数，看看对图片效果的影响
尝试图生图、图片编辑等进阶功能
把生成的高质量图片用于实际项目

记住，好的提示词是生成好图片的关键。多看看别人分享的提示词，学习怎么描述你想要的画面。FLUX模型对细节描述很敏感，越详细的提示词通常能得到越好的结果。

最后，生成图片需要耐心。第一次运行可能比较慢，但一旦模型加载到显存里，后续生成就会快很多。享受创造的过程，每一次点击“生成”都像是在开启一个未知的宝箱。

获取更多AI镜像

想探索更多AI镜像和应用场景？访问 CSDN星图镜像广场，提供丰富的预置镜像，覆盖大模型推理、图像生成、视频生成、模型微调等多个领域，支持一键部署。

九章云极普惠算力

更多推荐

Big快速上手：如何用简单的Markdown语法创建专业演示文稿

想要快速制作专业演示文稿却不想学习复杂的软件？Big是专为创意工作者和忙碌开发者设计的极简演示系统，让你告别繁琐配置，专注于内容本身。本文将为你介绍Big的核心功能、快速入门方法以及如何用简单的HTML创建令人印象深刻的演示文稿。## 🚀 什么是Big演示文稿系统？Big是一个轻量级的演示文稿系统，整个系统仅约16KB大小，采用纯HTML+CSS+JavaScript技术栈。它专为创意工