[Kimi-Linear] Correct prefixes and add compatibility to AWQ quants (#27834)

Signed-off-by: toncao <cpatonn@gmail.com> Co-authored-by: toncao <cpatonn@gmail.com>

[Kimi-Linear] Correct prefixes and add compatibility to AWQ quants (#27834)
Signed-off-by: toncao <cpatonn@gmail.com> Co-authored-by: toncao <cpatonn@gmail.com>
e5ef4dfc · toncao · GitHub · 36960501 · e5ef4dfc
Unverified Commit e5ef4dfc authored Oct 31, 2025 by toncao Committed by GitHub Oct 31, 2025
Hide whitespace changes
Inline Side-by-side

Showing with 2 additions and 1 deletion

vllm/model_executor/models/kimi_linear.py vllm/model_executor/models/kimi_linear.py +2 -1

No files found.
--- a/vllm/model_executor/models/kimi_linear.py
+++ b/vllm/model_executor/models/kimi_linear.py
@@ -155,6 +155,7 @@ class KimiMoE(nn.Module):
                hidden_act=config.hidden_act,
                quant_config=quant_config,
                reduce_results=False,
+                prefix=f"{prefix}.shared_experts",
            )

    def forward(self, hidden_states: torch.Tensor) -> torch.Tensor:
@@ -340,7 +341,7 @@ class KimiDecoderLayer(nn.Module):
            self.block_sparse_moe = KimiMoE(
                config=config,
                quant_config=quant_config,
-                prefix=f"{prefix}.mlp",
+                prefix=f"{prefix}.block_sparse_moe",
            )
            self.mlp = self.block_sparse_moe
        else: