ComfyUI Wan2.2比较A100 40G和4090 48G算力性能
本文对比了A100 40G和4090 48G显卡在ComfyUI的Wan2.2文生视频工作流中的性能表现。测试结果显示,在显存充足的情况下(14B模型完全载入显存),4090 48G以50秒完成5秒480p视频生成,略快于A100 40G的53秒。4090的GPU利用率达96%,高于A100的91%,显存占用38GB也高于A100的32GB。结论表明,在该场景下4090 48G的算力表现优于A10
之前使用ComfyUI的Wan2.2工作流比较过24G显存的3090和4090两张显卡的算力表现:
比较4090和3090在ComfyUI的Wan2.2工作流的性能表现
这里选用同一个 Wan2.2 ComfyUI 工作流,在文生视频场景下直接对比 A100 40 GB 与 4090 48 GB 的实测性能表现。
测试环境直接在晨涧云算力平台一键拉起:两台 Wan-ComfyUI 云容器实例,分别挂载 4090 48 GB 与 A100 40 GB,镜像、驱动、依赖完全一致,保证变量一致。

工作流沿用官方预置的「Wan2.2 14B T2V」14B 文生视频模板。随后用同一支 Python 脚本连续调用 ComfyUI API 生成视频,跑多次取平均,同时记录显存占用、GPU 利用率与端到端耗时,横向量化两张卡的差距。
先补充之前跑的4090 24G显卡的测试结果,用于更直观地进行对比。
4090 24G测试结果

4090 48G测试结果

A100 40G测试结果

测试结果解释
先跟 24 GB 的 4090 对比,A100 40 GB 和 4090 48 GB 两张卡都能把 14B 模型一次装进显存,中途不再往系统内存倒数据,显存占用明显上升,整体耗时比 24 GB 更少。
实测 5 秒 480p 视频,各跑 5 次取平均:
- A100 40 GB:53 秒
- 4090 48 GB:50 秒
资源占用:
- A100 平均 32 GB,平均 91 % GPU 利用率
- 4090 平均 38 GB,平均 96 % GPU 利用率
显存足够的情况下,4090 48G核心跑得更满,利用率更高。
整体测试结果,Wan 2.2文生视频场景,4090 48G的算力表现要略好于A100 40G。
更多推荐


所有评论(0)