Fix nemotron_nas intermediate_size computation (#30795)

Signed-off-by: Grzegorz Karch <gkarch@nvidia.com>

Fix nemotron_nas intermediate_size computation (#30795)
Signed-off-by: Grzegorz Karch <gkarch@nvidia.com>
f5db6385 · Grzegorz K. Karch · GitHub · c0a88df7 · f5db6385
Unverified Commit f5db6385 authored Dec 17, 2025 by Grzegorz K. Karch Committed by GitHub Dec 17, 2025
Hide whitespace changes
Inline Side-by-side

Showing with 7 additions and 4 deletions

vllm/model_executor/models/nemotron_nas.py vllm/model_executor/models/nemotron_nas.py +7 -4

No files found.
--- a/vllm/model_executor/models/nemotron_nas.py
+++ b/vllm/model_executor/models/nemotron_nas.py
@@ -169,10 +169,13 @@ class DeciLMDecoderLayer(nn.Module):
            self.input_layernorm = RMSNorm(config.hidden_size, eps=config.rms_norm_eps)
        if not self._is_no_op_ffn:
-            ffn_mult = block_config.ffn.ffn_mult
+            if hasattr(block_config.ffn, "ffn_mult"):
-            intermediate_size = _ffn_mult_to_intermediate_size(
+                ffn_mult = block_config.ffn.ffn_mult
-                ffn_mult, config.hidden_size
+                intermediate_size = _ffn_mult_to_intermediate_size(
-            )
+                    ffn_mult, config.hidden_size
+                )
+            else:
+                intermediate_size = block_config.ffn.intermediate_size
            self.mlp = LlamaMLP(
                hidden_size=self.hidden_size,