Fix Fused MoE LoRA Triton kernel bug (#28450)

Signed-off-by: chaojun-zhang <chaojun.zhang@intel.com>

Fix Fused MoE LoRA Triton kernel bug (#28450)
Signed-off-by: chaojun-zhang <chaojun.zhang@intel.com>
7dbe6d81 · Chaojun Zhang · GitHub · b30dfa03 · 7dbe6d81
Unverified Commit 7dbe6d81 authored Nov 11, 2025 by Chaojun Zhang Committed by GitHub Nov 11, 2025
Show whitespace changes
Inline Side-by-side

Showing with 2 additions and 1 deletion

vllm/lora/ops/triton_ops/fused_moe_lora_op.py vllm/lora/ops/triton_ops/fused_moe_lora_op.py +2 -1

No files found.
--- a/vllm/lora/ops/triton_ops/fused_moe_lora_op.py
+++ b/vllm/lora/ops/triton_ops/fused_moe_lora_op.py
@@ -26,7 +26,7 @@ def _get_ptr(lora_weights: list[torch.Tensor], device: torch.device):
    tensor_ptrs = []
    for lora_weight in lora_weights:
        tensor_ptrs.append(lora_weight.data_ptr())
-    ptr_tensor = torch.tensor(tensor_ptrs, device=device)
+    ptr_tensor = torch.tensor(tensor_ptrs, device=device, dtype=torch.uint64)

    _LORA_PTR_DICT[key] = ptr_tensor
    return _LORA_PTR_DICT.get(key)
@@ -85,6 +85,7 @@ def _fused_moe_lora_kernel(
    GROUP_SIZE_M: tl.constexpr,
    SPLIT_K: tl.constexpr,
    USE_GDC: tl.constexpr,
+    launch_pdl: tl.constexpr,
    IS_PRIMARY: tl.constexpr,
 ):
    pid = tl.program_id(axis=0)