update llama and qwen2 layout

92d43fd5 · zhuwenwen · 8f8d56c3 · 92d43fd5 · 92d43fd5
Commit 92d43fd5 authored Feb 09, 2025 by zhuwenwen
Hide whitespace changes
Inline Side-by-side

Showing with 10 additions and 4 deletions

vllm/model_executor/models/llama.py vllm/model_executor/models/llama.py +5 -2

vllm/model_executor/models/qwen2.py vllm/model_executor/models/qwen2.py +5 -2

No files found.
--- a/vllm/model_executor/models/llama.py
+++ b/vllm/model_executor/models/llama.py
@@ -477,7 +477,9 @@ class LlamaModel(nn.Module):
            # lay_qkv_words = ["self_attn.qkv_proj.weight"]   
            # qkv_words = "|".join(lay_qkv_words)          
            
-            for layername, weight in params_dict.items():
+            # for layername, weight in params_dict.items():
+            for layername in loaded_params:
+                weight = params_dict[layername]
                if "lm_head.weight" in layername and weight.shape[1] >= 4096:
                    lay_key_words.append("lm_head.weight")
                    combined_words = "|".join(lay_key_words)
@@ -512,7 +514,8 @@ class LlamaModel(nn.Module):
            ]
            combined_words = "|".join(lay_key_words)
            
-            for layername, weight in params_dict.items():
+            for layername in loaded_params:
+                weight = params_dict[layername]
                
                matches = re.findall(combined_words, layername)
                if matches:

--- a/vllm/model_executor/models/qwen2.py
+++ b/vllm/model_executor/models/qwen2.py
@@ -455,7 +455,9 @@ class Qwen2Model(nn.Module):
            # lay_qkv_bias_words = ["self_attn.qkv_proj.bias"]   
            # qkv_bias_words = "|".join(lay_qkv_bias_words) 
            
-            for layername, weight in params_dict.items():
+            # for layername, weight in params_dict.items():
+            for layername in loaded_params:
+                weight = params_dict[layername]
                if "lm_head.weight" in layername and weight.shape[1] >= 3584:
                    lay_key_words.append("lm_head.weight")
                    combined_words = "|".join(lay_key_words)
@@ -491,7 +493,8 @@ class Qwen2Model(nn.Module):
            ]
            combined_words = "|".join(lay_key_words)
            
-            for layername, weight in params_dict.items():
+            for layername in loaded_params:
+                weight = params_dict[layername]
                
                matches = re.findall(combined_words, layername)
                if matches: