Update qwen3_moe.py

07c69390 · zhuwenwen · 90e10dee · 07c69390
Commit 07c69390 authored Jun 10, 2025 by zhuwenwen
Hide whitespace changes
Inline Side-by-side

Showing with 4 additions and 4 deletions

vllm/model_executor/models/qwen3_moe.py vllm/model_executor/models/qwen3_moe.py +4 -4

No files found.
--- a/vllm/model_executor/models/qwen3_moe.py
+++ b/vllm/model_executor/models/qwen3_moe.py
@@ -332,9 +332,9 @@ class Qwen3MoeModel(nn.Module):
        self.padding_idx = config.pad_token_id
        self.vocab_size = config.vocab_size
        self.config = config
-        if self.config.quantization_config["bits"] == 4:
+        # if self.config.quantization_config["bits"] == 4:
-            os.environ['LLAMA_NN'] = '0'
+            # os.environ['LLAMA_NN'] = '0'
-            os.environ['LM_NN'] = '0'  
+            # os.environ['LM_NN'] = '0'  
        self.embed_tokens = VocabParallelEmbedding(
            config.vocab_size,
            config.hidden_size,
@@ -589,4 +589,4 @@ class Qwen3MoeForCausalLM(nn.Module, SupportsPP):
            self,
            skip_prefixes=(["rotary_emb.inv_freq"]),
        )
        return loader.load_weights(weights)
\ No newline at end of file