[XPU] Make pp group initilized for pipeline-parallelism (#11648)

Signed-off-by: yisheng <yi.sheng@intel.com>

[XPU] Make pp group initilized for pipeline-parallelism (#11648)
Signed-off-by: yisheng <yi.sheng@intel.com>
d93d2d74 · YiSheng5 · GitHub · d0169e1b · d93d2d74
Unverified Commit d93d2d74 authored Jan 07, 2025 by YiSheng5 Committed by GitHub Jan 07, 2025
Hide whitespace changes
Inline Side-by-side

Showing with 6 additions and 0 deletions

vllm/worker/xpu_worker.py vllm/worker/xpu_worker.py +6 -0

No files found.
--- a/vllm/worker/xpu_worker.py
+++ b/vllm/worker/xpu_worker.py
@@ -11,6 +11,7 @@ import torch.distributed
 from vllm.config import VllmConfig
 from vllm.distributed import (ensure_model_parallel_initialized,
                              init_distributed_environment)
+from vllm.distributed.parallel_state import get_pp_group
 from vllm.logger import init_logger
 from vllm.model_executor import set_random_seed
 from vllm.platforms import current_platform
@@ -176,3 +177,8 @@ class XPUWorker(LoraNotSupportedWorkerBase, Worker):
            parallel_config.pipeline_parallel_size)
        # global all_reduce needed for overall oneccl warm up
        torch.distributed.all_reduce(torch.zeros(1).xpu())
+        if parallel_config.pipeline_parallel_size > 1:
+            # Add pp group init to avoid
+            # p2p communication as the first call
+            get_pp_group().all_reduce(torch.zeros(1).xpu())