Merge branch 'v0.11.0-dev-wm-0120' into 'v0.11.0-dev'

[fix]解决glm4 moe + mtp精度异常 See merge request dcutoolkit/deeplearing/vllm!374

Merge branch 'v0.11.0-dev-wm-0120' into 'v0.11.0-dev'
[fix]解决glm4 moe + mtp精度异常 See merge request dcutoolkit/deeplearing/vllm!374
9bc81d6d · zhuwenwen · 6fa116fb · 0da696a7 · 9bc81d6d
Commit 9bc81d6d authored Jan 20, 2026 by zhuwenwen
Hide whitespace changes
Inline Side-by-side

Showing with 11 additions and 4 deletions

vllm/model_executor/models/glm4_moe_mtp.py vllm/model_executor/models/glm4_moe_mtp.py +11 -4

No files found.
--- a/vllm/model_executor/models/glm4_moe_mtp.py
+++ b/vllm/model_executor/models/glm4_moe_mtp.py
@@ -215,10 +215,17 @@ class Glm4MoeMTP(nn.Module, SupportsPP):
        params_dict = dict(self.named_parameters())
        loaded_params: set[str] = set()
        for name, loaded_weight in weights:
-            spec_layer = get_spec_layer_idx_from_weight_name(self.config, name)
-            if spec_layer is None:
-                continue
-            name = self._rewrite_spec_layer_name(spec_layer, name)
+            if name == "lm_head.weight":
+                spec_layer = self.model.mtp_start_layer_idx
+                name = f"model.layers.{spec_layer}.shared_head.head.weight"
+            elif name == "model.embed_tokens.weight":
+                spec_layer = self.model.mtp_start_layer_idx
+            else:
+                spec_layer = get_spec_layer_idx_from_weight_name(self.config, name)
+                if spec_layer is None:
+                    continue
+                name = self._rewrite_spec_layer_name(spec_layer, name)
+            
            for (param_name, weight_name, shard_id) in stacked_params_mapping:
                # Skip non-stacked layers and experts (experts handled below).
                if weight_name not in name: