hotfix: fix flashllama

27ff1871 · OlivierDehaene · 03c9388b · 27ff1871
Unverified Commit 27ff1871 authored Oct 23, 2024 by OlivierDehaene
Hide whitespace changes
Inline Side-by-side

Showing with 1 addition and 1 deletion

server/text_generation_server/models/custom_modeling/flash_llama_modeling.py ...ion_server/models/custom_modeling/flash_llama_modeling.py +1 -1

No files found.
--- a/server/text_generation_server/models/custom_modeling/flash_llama_modeling.py
+++ b/server/text_generation_server/models/custom_modeling/flash_llama_modeling.py
@@ -692,7 +692,7 @@ class FlashLlamaForCausalLM(torch.nn.Module):
        logits, speculative_logits = self.lm_head(hidden_states)

        # Used in Granite
-        if not self.logits_scaled:
+        if self.logits_scaling is not None and not self.logits_scaled:
            logits /= self.logits_scaling
            if speculative_logits is not None:
                speculative_logits /= self.logits_scaling