Fix post gemma merge (#31660)

* nit * toctree issue * protect gemma2 tests as well * sdpa supported

Fix post gemma merge (#31660)
* nit * toctree issue * protect gemma2 tests as well * sdpa supported
75a63198 · Arthur · GitHub · 727eea4a · 75a63198 · 75a63198
Unverified Commit 75a63198 authored Jun 27, 2024 by Arthur Committed by GitHub Jun 27, 2024
3 changed files
--- a/docs/source/en/_toctree.yml
+++ b/docs/source/en/_toctree.yml
@@ -382,6 +382,8 @@
        title: Fuyu
      - local: model_doc/gemma
        title: Gemma
+      - local: model_doc/gemma2
+        title: Gemma2
      - local: model_doc/openai-gpt
        title: GPT
      - local: model_doc/gpt_neo

--- a/docs/source/en/perf_infer_gpu_one.md
+++ b/docs/source/en/perf_infer_gpu_one.md
@@ -43,6 +43,7 @@ FlashAttention-2 is currently supported for the following architectures:
 * [Dbrx](https://huggingface.co/docs/transformers/model_doc/dbrx#transformers.DbrxModel)
 * [DistilBert](https://huggingface.co/docs/transformers/model_doc/distilbert#transformers.DistilBertModel)
 * [Gemma](https://huggingface.co/docs/transformers/model_doc/gemma#transformers.GemmaModel)
+* [Gemma2](https://huggingface.co/docs/transformers/model_doc/gemma2#transformers.Gemma2Model)
 * [GPT2](https://huggingface.co/docs/transformers/model_doc/gpt2)
 * [GPTBigCode](https://huggingface.co/docs/transformers/model_doc/gpt_bigcode#transformers.GPTBigCodeModel)
 * [GPTNeo](https://huggingface.co/docs/transformers/model_doc/gpt_neo#transformers.GPTNeoModel)
@@ -202,6 +203,7 @@ For now, Transformers supports SDPA inference and training for the following arc
 * [Dpr](https://huggingface.co/docs/transformers/model_doc/dpr#transformers.DprReader)
 * [Falcon](https://huggingface.co/docs/transformers/model_doc/falcon#transformers.FalconModel)
 * [Gemma](https://huggingface.co/docs/transformers/model_doc/gemma#transformers.GemmaModel)
+* [Gemma2](https://huggingface.co/docs/transformers/model_doc/gemma2#transformers.Gemma2Model)
 * [GPT2](https://huggingface.co/docs/transformers/model_doc/gpt2)
 * [GPTBigCode](https://huggingface.co/docs/transformers/model_doc/gpt_bigcode#transformers.GPTBigCodeModel)
 * [GPTNeoX](https://huggingface.co/docs/transformers/model_doc/gpt_neox#transformers.GPTNeoXModel)

--- a/tests/models/gemma2/test_modeling_gemma2.py
+++ b/tests/models/gemma2/test_modeling_gemma2.py
@@ -41,11 +41,12 @@ if is_torch_available():
 class Gemma2ModelTester(GemmaModelTester):
-    config_class = Gemma2Config
+    if is_torch_available():
-    model_class = Gemma2Model
+        config_class = Gemma2Config
-    for_causal_lm_class = Gemma2ForCausalLM
+        model_class = Gemma2Model
-    for_sequence_class = Gemma2ForSequenceClassification
+        for_causal_lm_class = Gemma2ForCausalLM
-    for_token_class = Gemma2ForTokenClassification
+        for_sequence_class = Gemma2ForSequenceClassification
+        for_token_class = Gemma2ForTokenClassification
 @require_torch