update fused_moe.py

b1babea8 · zhuwenwen · 5c004388 · b1babea8
Commit b1babea8 authored Jul 18, 2025 by zhuwenwen
Hide whitespace changes
Inline Side-by-side

Showing with 9 additions and 9 deletions

vllm/model_executor/layers/fused_moe/fused_moe.py vllm/model_executor/layers/fused_moe/fused_moe.py +9 -9

No files found.
--- a/vllm/model_executor/layers/fused_moe/fused_moe.py
+++ b/vllm/model_executor/layers/fused_moe/fused_moe.py
@@ -704,9 +704,9 @@ def invoke_fused_moe_kernel(A: torch.Tensor,
                get_moe_wna16_block_config(config=config,
                                           use_moe_wna16_cuda=use_moe_wna16_cuda,
                                           num_valid_tokens=num_tokens,
-                                           size_k=A.size[1],
+                                           size_k=A.size(1),
-                                           size_n=B.size[1],
+                                           size_n=B.size(1),
-                                           num_experts=B.size[1],
+                                           num_experts=B.size(1),
                                           group_size=block_shape[1],
                                           real_top_k=top_k,
                                           block_size_m=config["BLOCK_SIZE_M"]))
@@ -732,8 +732,8 @@ def invoke_fused_moe_kernel(A: torch.Tensor,
                sorted_token_ids,
                expert_ids,
                num_tokens_post_padded,
-                B.size[1],
+                B.size(1),
-                A.size[1],
+                A.size(1),
                EM,
                topk_ids.numel(),
                A.stride(0),
@@ -749,7 +749,7 @@ def invoke_fused_moe_kernel(A: torch.Tensor,
                B_zp.stride(0) if B_zp is not None else 0,
                B_zp.stride(2) if B_zp is not None else 0,
                B_zp.stride(1) if B_zp is not None else 0,
-                block_k_diviable=A.size[1] % config["BLOCK_SIZE_K"] == 0,
+                block_k_diviable=A.size(1) % config["BLOCK_SIZE_K"] == 0,
                group_size=block_shape[1],
                MUL_ROUTED_WEIGHT=mul_routed_weight,
                top_k=top_k,
@@ -770,8 +770,8 @@ def invoke_fused_moe_kernel(A: torch.Tensor,
                sorted_token_ids,
                expert_ids,
                num_tokens_post_padded,
-                B.size[1],
+                B.size(1),
-                A.size[1],
+                A.size(1),
                EM,
                num_tokens,
                A.stride(0),
@@ -787,7 +787,7 @@ def invoke_fused_moe_kernel(A: torch.Tensor,
                B_zp.stride(0) if B_zp is not None else 0,
                B_zp.stride(2) if B_zp is not None else 0,
                B_zp.stride(1) if B_zp is not None else 0,
-                block_k_diviable=A.size[1] % config["BLOCK_SIZE_K"] == 0,
+                block_k_diviable=A.size(1) % config["BLOCK_SIZE_K"] == 0,
                group_size=block_shape[1],
                MUL_ROUTED_WEIGHT=mul_routed_weight,
                top_k=top_k,