set VLLM_USE_OPT_RESHAPE_AND_CACHE=1 for qwen3-30b

8364249c · zhuwenwen · d533c559 · 8364249c
Commit 8364249c authored Dec 03, 2025 by zhuwenwen
Show whitespace changes
Inline Side-by-side

Showing with 4 additions and 4 deletions

vllm/model_executor/model_loader/utils.py vllm/model_executor/model_loader/utils.py +4 -4

No files found.
--- a/vllm/model_executor/model_loader/utils.py
+++ b/vllm/model_executor/model_loader/utils.py
@@ -269,8 +269,8 @@ def get_model_architecture(
                        os.environ['VLLM_USE_LIGHTOP_MOE_SUM'] = '1'    
                    if not envs.is_set("VLLM_USE_FUSE_SILU_AND_MUL"):
                        os.environ['VLLM_USE_FUSE_SILU_AND_MUL'] = '1'
-                    # if not envs.is_set("VLLM_USE_OPT_RESHAPE_AND_CACHE"):
-                    #     os.environ['VLLM_USE_OPT_RESHAPE_AND_CACHE'] = '1'
+                    if not envs.is_set("VLLM_USE_OPT_RESHAPE_AND_CACHE"):
+                        os.environ['VLLM_USE_OPT_RESHAPE_AND_CACHE'] = '1'
                
            if architectures in [['DeepseekV32ForCausalLM']]:
                if not envs.is_set("VLLM_USE_V32_ENCODE"):
@@ -305,8 +305,8 @@ def get_model_architecture(
                        os.environ['VLLM_USE_LIGHTOP_MOE_SUM'] = '1' 
                    if not envs.is_set("VLLM_USE_FUSE_SILU_AND_MUL"):
                        os.environ['VLLM_USE_FUSE_SILU_AND_MUL'] = '1'
-                    # if not envs.is_set("VLLM_USE_OPT_RESHAPE_AND_CACHE"):
-                    #     os.environ['VLLM_USE_OPT_RESHAPE_AND_CACHE'] = '1'
+                    if not envs.is_set("VLLM_USE_OPT_RESHAPE_AND_CACHE"):
+                        os.environ['VLLM_USE_OPT_RESHAPE_AND_CACHE'] = '1'
                 
            if architectures in [['DeepseekV32ForCausalLM']]:
                if not envs.is_set("VLLM_USE_V32_ENCODE"):