之前使用ComfyUI的Wan2.2工作流比较过24G显存的3090和4090两张显卡的算力表现:
比较4090和3090在ComfyUI的Wan2.2工作流的性能表现

这里选用同一个 Wan2.2 ComfyUI 工作流,在文生视频场景下直接对比 A100 40 GB 与 4090 48 GB 的实测性能表现。

测试环境直接在晨涧云算力平台一键拉起:两台 Wan-ComfyUI 云容器实例,分别挂载 4090 48 GB 与 A100 40 GB,镜像、驱动、依赖完全一致,保证变量一致。

ComfyUI-Wan-14B-T2V-工作流

工作流沿用官方预置的「Wan2.2 14B T2V」14B 文生视频模板。随后用同一支 Python 脚本连续调用 ComfyUI API 生成视频,跑多次取平均,同时记录显存占用、GPU 利用率与端到端耗时,横向量化两张卡的差距。

先补充之前跑的4090 24G显卡的测试结果,用于更直观地进行对比。

4090 24G测试结果

4090-ComfyUI-Wan测试结果

4090 48G测试结果

4090_48G-ComfyUI-Wan测试结果

A100 40G测试结果

A100-40G-ComfyUI-Wan测试结果

测试结果解释

先跟 24 GB 的 4090 对比,A100 40 GB 和 4090 48 GB 两张卡都能把 14B 模型一次装进显存,中途不再往系统内存倒数据,显存占用明显上升,整体耗时比 24 GB 更少。

实测 5 秒 480p 视频,各跑 5 次取平均:

  • A100 40 GB:53 秒
  • 4090 48 GB:50 秒

资源占用:

  • A100 平均 32 GB,平均 91 % GPU 利用率
  • 4090 平均 38 GB,平均 96 % GPU 利用率

显存足够的情况下,4090 48G核心跑得更满,利用率更高。

整体测试结果,Wan 2.2文生视频场景,4090 48G的算力表现要略好于A100 40G

更多推荐