hotfix: Fix number of KV heads (#2202)

Fix number of KV heads

hotfix: Fix number of KV heads (#2202)
Fix number of KV heads
cce475a9 · Daniël de Kok · GitHub · 521d0d99 · cce475a9
Unverified Commit cce475a9 authored Jul 08, 2024 by Daniël de Kok Committed by GitHub Jul 08, 2024
Hide whitespace changes
Inline Side-by-side

Showing with 2 additions and 2 deletions

server/text_generation_server/models/flash_causal_lm.py server/text_generation_server/models/flash_causal_lm.py +2 -2

No files found.
--- a/server/text_generation_server/models/flash_causal_lm.py
+++ b/server/text_generation_server/models/flash_causal_lm.py
@@ -906,8 +906,8 @@ class FlashCausalLM(Model):
        # Validation is done in the model itself
        if num_kv_heads is None:
            # Order is important here.
-            for attr in ["num_key_value_heads", "num_key_value_heads", "n_head"]:
-                num_kv_heads = getattr(config, "num_attention_heads", None)
+            for attr in ["num_key_value_heads", "num_attention_heads", "n_head"]:
+                num_kv_heads = getattr(config, attr, None)
                if num_kv_heads is not None:
                    break
            if num_kv_heads is None: