# 并行推理 LightX2V 支持分布式并行推理,能够利用多个 GPU 进行推理。DiT部分支持两种并行注意力机制:**Ulysses** 和 **Ring**,同时还支持 **VAE 并行推理**。并行推理,显著降低推理耗时和减轻每个GPU的显存开销。 ## DiT 并行配置 DiT 并行是通过 `parallel_attn_type` 参数控制的,支持两种并行注意力机制: ### 1. Ulysses 并行 **配置方式:** ```json { "parallel_attn_type": "ulysses" } ``` ### 2. Ring 并行 **配置方式:** ```json { "parallel_attn_type": "ring" } ``` ## VAE 并行配置 VAE 并行是通过 `parallel_vae` 参数控制: ```json { "parallel_vae": true } ``` **配置说明:** - `parallel_vae: true`:启用 VAE 并行推理(推荐设置) - `parallel_vae: false`:禁用 VAE 并行,使用单 GPU 处理 **使用建议:** - 在多 GPU 环境下,建议始终启用 VAE 并行 - VAE 并行可与任何注意力并行方式(Ulysses/Ring)组合使用 - 对于内存受限的场景,VAE 并行可显著减少内存使用 ## 使用方式 并行推理的config文件在[这里](https://github.com/ModelTC/lightx2v/tree/main/configs/dist_infer) 通过指定--config_json到具体的config文件,即可以测试并行推理 [这里](https://github.com/ModelTC/lightx2v/tree/main/scripts/dist_infer)有一些运行脚本供使用。