fix: prefer hidden_activation over hidden_act in gemma2 (#2381)

f8521900 · drbh · GitHub · 2ca59806 · f8521900
Unverified Commit f8521900 authored Aug 08, 2024 by drbh Committed by GitHub Aug 08, 2024
Hide whitespace changes
Inline Side-by-side

Showing with 1 addition and 1 deletion

server/text_generation_server/models/custom_modeling/flash_gemma2_modeling.py ...on_server/models/custom_modeling/flash_gemma2_modeling.py +1 -1

No files found.
--- a/server/text_generation_server/models/custom_modeling/flash_gemma2_modeling.py
+++ b/server/text_generation_server/models/custom_modeling/flash_gemma2_modeling.py
@@ -265,7 +265,7 @@ class FlashGemma2Attention(torch.nn.Module):
 class Gemma2MLP(nn.Module):
    def __init__(self, prefix, config, weights):
        super().__init__()
-        act = config.hidden_act
+        act = config.hidden_activation
        self.act = (
            ACT2FN[act]
            if "gelu" not in act