比迪丽LoRA部署教程：Ubuntu+Docker环境下GPU算力高效利用

本文介绍了如何在星图GPU平台上自动化部署比迪丽（Videl / Bidili） AI 绘画 LoRA 角色模型。该平台简化了在Ubuntu与Docker环境下的部署流程，并充分利用GPU算力，旨在帮助用户高效生成基于《龙珠》角色比迪丽的定制化AI绘画作品，提升角色创作效率。

十二月极光

328人浏览 · 2026-03-16 00:38:56

十二月极光 · 2026-03-16 00:38:56 发布

比迪丽LoRA部署教程：Ubuntu+Docker环境下GPU算力高效利用

1. 前言：为什么选择这个方案？

如果你玩过AI绘画，肯定遇到过这样的烦恼：想画个特定角色，比如《龙珠》里的比迪丽，但用通用模型画出来的总是不太像。要么脸型不对，要么发型有偏差，要么就是少了那种独特的英气。

这时候，LoRA模型就派上用场了。它就像给AI模型加了个“角色插件”，专门学习某个特定角色的特征，让你能稳定生成这个角色的各种图片。今天要部署的比迪丽LoRA模型，就是这样一个专门为生成比迪丽角色设计的模型。

但问题来了：怎么部署才能既简单又高效？特别是当你手头有GPU资源时，怎么让它发挥最大作用？

这就是本文要解决的问题。我将带你一步步在Ubuntu系统上，用Docker方式部署比迪丽LoRA模型，并且重点讲解如何充分利用GPU算力，让你生成图片的速度快人一步。

2. 环境准备：检查你的装备

在开始之前，我们先确认一下你的环境是否满足要求。别担心，要求并不高。

2.1 硬件要求

项目	最低要求	推荐配置
GPU	NVIDIA显卡，4GB显存	NVIDIA显卡，8GB以上显存
内存	8GB	16GB以上
存储	20GB可用空间	50GB以上可用空间
系统	Ubuntu 20.04或更高	Ubuntu 22.04 LTS

重点说一下GPU：这个模型支持CUDA加速，有GPU的话生成速度能快好几倍。如果你用的是云服务器，确保选择带GPU的实例；如果是自己的电脑，确认一下显卡型号和驱动。

2.2 软件要求

需要提前安装好的软件：

Docker：容器化部署的核心
NVIDIA Container Toolkit：让Docker能用上GPU
Git：下载代码和模型

如果你不确定这些软件是否安装，别急，接下来的步骤会包含安装方法。

3. 一步步部署：从零到可用

好了，准备工作说完，咱们正式开始部署。我会把每个步骤都讲清楚，确保你跟着做就能成功。

3.1 第一步：安装Docker和NVIDIA支持

打开你的Ubuntu终端，依次执行以下命令：

# 更新系统包列表
sudo apt update

# 安装Docker的依赖包
sudo apt install -y apt-transport-https ca-certificates curl software-properties-common

# 添加Docker官方GPG密钥
curl -fsSL https://download.docker.com/linux/ubuntu/gpg | sudo apt-key add -

# 添加Docker仓库
sudo add-apt-repository "deb [arch=amd64] https://download.docker.com/linux/ubuntu $(lsb_release -cs) stable"

# 安装Docker
sudo apt update
sudo apt install -y docker-ce docker-ce-cli containerd.io

# 将当前用户加入docker组（避免每次都要sudo）
sudo usermod -aG docker $USER

# 安装NVIDIA Container Toolkit
distribution=$(. /etc/os-release;echo $ID$VERSION_ID)
curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | sudo apt-key add -
curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | sudo sudo tee /etc/apt/sources.list.d/nvidia-docker.list

sudo apt update
sudo apt install -y nvidia-docker2
sudo systemctl restart docker

重要提示：执行完usermod命令后，你需要重新登录系统或者新开一个终端，这样docker组权限才会生效。

3.2 第二步：验证GPU支持

安装完成后，我们来测试一下Docker能不能用上GPU：

# 运行一个简单的测试容器
sudo docker run --rm --gpus all nvidia/cuda:11.0-base nvidia-smi

如果看到类似下面的输出，说明GPU支持已经配置好了：

+-----------------------------------------------------------------------------+
| NVIDIA-SMI 470.161.03   Driver Version: 470.161.03   CUDA Version: 11.4     |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|                               |                      |               MIG M. |
|===============================+======================+======================|
|   0  Tesla T4            Off  | 00000000:00:04.0 Off |                    0 |
| N/A   34C    P8     9W /  70W |      0MiB / 15109MiB |      0%      Default |
|                               |                      |                  N/A |
+-------------------------------+----------------------+----------------------+

3.3 第三步：下载比迪丽LoRA模型

现在我们来获取比迪丽LoRA模型文件。这里有两种方式，你可以选择其中一种。

方式一：直接下载（推荐）

# 创建模型存放目录
mkdir -p ~/models/lora
cd ~/models/lora

# 下载比迪丽LoRA模型
# 注意：这里需要替换为实际的模型下载链接
# 假设模型文件名为：bidili_lora.safetensors
wget https://example.com/models/bidili_lora.safetensors

方式二：从Hugging Face下载

如果你有Hugging Face账号，也可以从那里下载：

# 安装huggingface-hub
pip install huggingface-hub

# 下载模型
python -c "from huggingface_hub import snapshot_download; snapshot_download(repo_id='username/bidili-lora', local_dir='~/models/lora')"

模型文件说明：

文件格式：通常是.safetensors或.ckpt
文件大小：一般在100MB-500MB之间
存放位置：记住你存放的路径，后面会用到

3.4 第四步：准备WebUI Docker镜像

比迪丽LoRA模型需要配合一个Web界面来使用。我们选择用Automatic1111的Stable Diffusion WebUI，因为它对LoRA支持很好。

创建一个部署目录，并准备配置文件：

# 创建项目目录
mkdir -p ~/bidili-webui
cd ~/bidili-webui

# 创建docker-compose.yml文件
cat > docker-compose.yml << 'EOF'
version: '3.8'

services:
  webui:
    image: ghcr.io/automatic1111/stable-diffusion-webui:latest
    container_name: bidili-webui
    runtime: nvidia
    deploy:
      resources:
        reservations:
          devices:
            - driver: nvidia
              count: all
              capabilities: [gpu]
    ports:
      - "7860:7860"
    volumes:
      - ./models:/stable-diffusion-webui/models
      - ./outputs:/stable-diffusion-webui/outputs
      - ./config:/stable-diffusion-webui/config
    environment:
      - CLI_ARGS=--listen --port 7860 --enable-insecure-extension-access
    restart: unless-stopped
EOF

# 创建必要的目录结构
mkdir -p models/{Stable-diffusion,Lora,VAE,ControlNet}
mkdir -p outputs config

# 将之前下载的LoRA模型复制到正确位置
cp ~/models/lora/bidili_lora.safetensors ./models/Lora/

3.5 第五步：启动WebUI服务

现在一切准备就绪，可以启动服务了：

# 进入项目目录
cd ~/bidili-webui

# 启动服务（第一次运行会下载基础模型，时间较长）
sudo docker-compose up -d

# 查看服务状态
sudo docker-compose ps

# 查看日志（观察启动过程）
sudo docker-compose logs -f webui

第一次启动时，Docker会下载Automatic1111 WebUI的镜像，然后容器内部会自动下载Stable Diffusion的基础模型。这个过程可能需要一些时间，具体取决于你的网络速度。

耐心等待，当你看到日志中出现类似这样的信息时，说明服务已经启动成功：

Running on local URL:  http://0.0.0.0:7860

3.6 第六步：配置比迪丽LoRA模型

服务启动后，打开浏览器访问：http://你的服务器IP:7860

第一次访问时，WebUI会进行一些初始化。完成后，我们需要配置LoRA模型：

点击左上角的"Show extra networks"按钮（图标像一个小卡片）
切换到"Lora"标签页
你应该能看到"bidili_lora"这个模型
点击它，它会被添加到提示词中，格式类似：<lora:bidili_lora:1>

4. GPU算力优化：让生成速度飞起来

现在服务已经跑起来了，但你可能发现生成图片的速度还不够快。别急，我们来优化GPU的使用。

4.1 检查GPU使用情况

首先，看看当前GPU的使用情况：

# 在宿主机上查看
nvidia-smi

# 或者在容器内查看
sudo docker exec bidili-webui nvidia-smi

你应该能看到GPU正在被使用，但可能利用率不高。

4.2 调整WebUI参数优化性能

在WebUI的设置页面（Settings），有几个关键参数可以调整：

Cross attention optimization：
- 选择xFormers（如果可用）
- 或者选择Doggettx（兼容性更好）
Token merging ratio：
- 设置为0.2-0.3，可以在几乎不影响质量的情况下提升速度
GPU memory usage：
- 如果显存充足（8GB以上），选择Full precision
- 如果显存紧张，选择FP16或BF16
Batch size：
- 根据显存调整，一般设置为1-2
- 可以在txt2img标签页的"Batch count"和"Batch size"中调整

4.3 Docker容器GPU资源限制

如果你在同一台机器上运行多个服务，可能需要限制每个容器使用的GPU资源：

# 修改docker-compose.yml中的deploy部分
deploy:
  resources:
    reservations:
      devices:
        - driver: nvidia
          count: 1  # 只使用1个GPU
          device_ids: ['0']  # 使用GPU 0
          capabilities: [gpu]
    limits:
      cpus: '4.0'  # 限制CPU使用
      memory: 8G   # 限制内存使用

4.4 使用TensorRT加速（高级优化）

如果你使用的是NVIDIA RTX系列显卡，可以尝试使用TensorRT进一步加速：

# 进入容器
sudo docker exec -it bidili-webui bash

# 安装TensorRT扩展（在容器内）
cd /stable-diffusion-webui/extensions
git clone https://github.com/NVIDIA/TensorRT.git
cd TensorRT
pip install -r requirements.txt

# 转换模型为TensorRT格式
# 这需要一些时间，但转换后推理速度能提升2-3倍

注意：TensorRT优化需要模型转换，第一次使用时会比较耗时，但后续生成速度会有显著提升。

4.5 监控和调优工具

安装一些监控工具，帮助你了解GPU使用情况：

# 安装nvtop（GPU监控工具）
sudo apt install nvtop

# 运行nvtop查看实时GPU使用情况
nvtop

在nvtop界面中，你可以看到：

GPU利用率（Util%）
显存使用情况（Memory）
温度（Temp）
功耗（Power）

根据这些信息，你可以调整生成参数，找到速度和质量的平衡点。

5. 使用技巧：画出完美的比迪丽

现在服务优化好了，我们来聊聊怎么用好这个模型。

5.1 基础提示词模板

要生成比迪丽角色，记得在提示词中加入触发词。根据你的输入内容，触发词可以是：

bidili
videl
比迪丽

基础模板：

bidili, 1girl, [姿势描述], [场景描述], [服装描述], masterpiece, best quality, highly detailed

示例1：战斗姿态

bidili, 1girl, martial arts stance, determined expression, wearing fighting gi, in tournament arena, dynamic pose, action scene, masterpiece, best quality

示例2：日常装扮

videl, 1girl, smiling, casual clothes, sitting in cafe, soft lighting, peaceful atmosphere, anime style, masterpiece

5.2 LoRA权重调整

在提示词中，LoRA的权重可以调整：

<lora:bidili_lora:1.0>：标准权重
<lora:bidili_lora:0.8>：减弱特征，更通用
<lding:bidili_lora:1.2>：增强特征，更接近原角色

技巧：权重不是越高越好，0.7-1.0之间通常效果最佳。

5.3 与其他LoRA组合

比迪丽LoRA可以和其他LoRA组合使用，创造更多样化的效果：

<lora:bidili_lora:0.8>, <lora:anime_style:0.6>, 1girl, school uniform, classroom setting

这样既能保留比迪丽的特征，又能加入动漫风格的画风。

5.4 参数设置建议

根据你的GPU性能，调整这些参数：

GPU性能	图片尺寸	步数	批量大小	预估时间
低端GPU（4GB）	512×512	20	1	10-15秒
中端GPU（8GB）	768×768	30	1	8-12秒
高端GPU（12GB+）	1024×1024	50	2	15-20秒

小技巧：先用小尺寸和低步数测试构图，满意后再用高参数生成最终图。

6. 常见问题解决

部署和使用过程中可能会遇到一些问题，这里整理了一些常见问题的解决方法。

6.1 服务启动失败

问题：Docker容器启动失败，提示端口被占用。

解决：

# 检查7860端口是否被占用
sudo lsof -i :7860

# 如果被占用，可以修改docker-compose.yml中的端口映射
# 将"7860:7860"改为"7861:7860"，然后通过7861端口访问

6.2 GPU不被识别

问题：容器内无法使用GPU，nvidia-smi命令失败。

解决：

# 检查NVIDIA Container Toolkit是否安装正确
docker run --rm --gpus all nvidia/cuda:11.0-base nvidia-smi

# 重新安装NVIDIA Container Toolkit
sudo apt purge nvidia-docker2
sudo apt install nvidia-docker2
sudo systemctl restart docker

6.3 生成速度慢

问题：图片生成时间超过30秒。

解决：

检查GPU使用率：nvidia-smi查看Util%是否接近100%
降低图片尺寸：从1024×1024降到768×768
减少推理步数：从50步降到30步
启用xFormers优化（在WebUI设置中）

6.4 显存不足

问题：生成时提示CUDA out of memory。

解决：

# 修改WebUI启动参数，在docker-compose.yml中添加：
environment:
  - CLI_ARGS=--listen --port 7860 --medvram --always-batch-cond-uncond

# 或者在WebUI设置中：
# 1. 启用"Low VRAM"模式
# 2. 使用FP16精度代替FP32
# 3. 减少Batch size到1

6.5 模型加载失败

问题：LoRA模型在WebUI中不显示。

解决：

# 进入容器检查模型文件
sudo docker exec -it bidili-webui bash
ls /stable-diffusion-webui/models/Lora/

# 如果文件不存在，重新复制
sudo docker cp ~/models/lora/bidili_lora.safetensors bidili-webui:/stable-diffusion-webui/models/Lora/

# 重启WebUI
sudo docker-compose restart webui

7. 进阶配置：让系统更稳定高效

如果你打算长期使用这个服务，可以考虑以下优化。

7.1 设置自动重启

修改docker-compose.yml，确保服务异常时能自动恢复：

services:
  webui:
    # ... 其他配置 ...
    restart: always
    healthcheck:
      test: ["CMD", "curl", "-f", "http://localhost:7860"]
      interval: 30s
      timeout: 10s
      retries: 3
      start_period: 40s

7.2 配置资源限制

防止WebUI占用过多资源影响其他服务：

services:
  webui:
    # ... 其他配置 ...
    deploy:
      resources:
        limits:
          cpus: '4.0'
          memory: 12G
        reservations:
          devices:
            - driver: nvidia
              count: 1
              capabilities: [gpu]

7.3 设置定期清理

AI绘画会生成大量图片，定期清理可以节省空间：

# 创建清理脚本
cat > ~/cleanup.sh << 'EOF'
#!/bin/bash
# 删除7天前的输出文件
find ~/bidili-webui/outputs -type f -mtime +7 -delete
# 删除空目录
find ~/bidili-webui/outputs -type d -empty -delete
EOF

# 添加执行权限
chmod +x ~/cleanup.sh

# 添加到crontab，每周清理一次
(crontab -l 2>/dev/null; echo "0 2 * * 0 /home/$(whoami)/cleanup.sh") | crontab -

7.4 配置反向代理（可选）

如果你希望通过域名访问，可以配置Nginx反向代理：

server {
    listen 80;
    server_name your-domain.com;
    
    location / {
        proxy_pass http://localhost:7860;
        proxy_set_header Host $host;
        proxy_set_header X-Real-IP $remote_addr;
        proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;
        proxy_set_header X-Forwarded-Proto $scheme;
    }
}

8. 总结

通过这篇教程，你应该已经成功在Ubuntu系统上部署了比迪丽LoRA模型，并且学会了如何优化GPU使用，让生成速度最大化。

让我简单回顾一下关键点：

部署其实不难：用Docker可以避免环境配置的麻烦，一条命令就能启动服务
GPU是关键：有GPU和没GPU的速度差异很大，一定要确保GPU驱动和Docker的GPU支持配置正确
优化有技巧：通过调整WebUI参数、使用xFormers、合理设置图片尺寸等，可以进一步提升性能
使用要讲究：好的提示词加上合适的LoRA权重，才能生成理想的图片

这个方案有几个明显的优势：

隔离性好：Docker容器让环境干净，不会影响宿主机
可移植性强：配置好的服务可以轻松迁移到其他机器
资源可控：可以精确控制CPU、内存、GPU的使用
维护简单：更新、备份、恢复都很方便

如果你在部署或使用过程中遇到问题，不要着急。AI绘画的部署确实会有一些小坑，但大多数问题都有解决方案。多看看日志输出，按照错误信息去搜索，通常都能找到答案。

最后，别忘了享受创作的过程。比迪丽这个角色有很多可以挖掘的特点——她的英气、她的成长、她和悟饭的故事。用AI把这些瞬间画出来，本身就是一件很有趣的事情。

获取更多AI镜像

想探索更多AI镜像和应用场景？访问 CSDN星图镜像广场，提供丰富的预置镜像，覆盖大模型推理、图像生成、视频生成、模型微调等多个领域，支持一键部署。

九章云极普惠算力

更多推荐

Big快速上手：如何用简单的Markdown语法创建专业演示文稿

想要快速制作专业演示文稿却不想学习复杂的软件？Big是专为创意工作者和忙碌开发者设计的极简演示系统，让你告别繁琐配置，专注于内容本身。本文将为你介绍Big的核心功能、快速入门方法以及如何用简单的HTML创建令人印象深刻的演示文稿。## 🚀 什么是Big演示文稿系统？Big是一个轻量级的演示文稿系统，整个系统仅约16KB大小，采用纯HTML+CSS+JavaScript技术栈。它专为创意工