[MusicGen] Add sampling rate to config (#26136)

* [MusicGen] Add sampling rate to config * remove tiny * make property * Update tests/pipelines/test_pipelines_text_to_audio.py Co-authored-by: Arthur <48595927+ArthurZucker@users.noreply.github.com> * style --------- Co-authored-by: Arthur <48595927+ArthurZucker@users.noreply.github.com>

[MusicGen] Add sampling rate to config (#26136)
* [MusicGen] Add sampling rate to config * remove tiny * make property * Update tests/pipelines/test_pipelines_text_to_audio.py Co-authored-by: Arthur <48595927+ArthurZucker@users.noreply.github.com> * style --------- Co-authored-by: Arthur <48595927+ArthurZucker@users.noreply.github.com>
44a0490d · Sanchit Gandhi · GitHub · 8881f38a · 44a0490d · 44a0490d
Unverified Commit 44a0490d authored Sep 14, 2023 by Sanchit Gandhi Committed by GitHub Sep 14, 2023
2 changed files
--- a/src/transformers/models/musicgen/configuration_musicgen.py
+++ b/src/transformers/models/musicgen/configuration_musicgen.py
@@ -226,3 +226,8 @@ class MusicgenConfig(PretrainedConfig):
            decoder=decoder_config.to_dict(),
            **kwargs,
        )
+    @property
+    # This is a property because you might want to change the codec model on the fly
+    def sampling_rate(self):
+        return self.audio_encoder.sampling_rate
--- a/tests/pipelines/test_pipelines_text_to_audio.py
+++ b/tests/pipelines/test_pipelines_text_to_audio.py
@@ -41,35 +41,32 @@ class TextToAudioPipelineTests(unittest.TestCase):
    @slow
    @require_torch
-    def test_small_model_pt(self):
+    def test_small_musicgen_pt(self):
-        speech_generator = pipeline(task="text-to-audio", model="facebook/musicgen-small", framework="pt")
+        music_generator = pipeline(task="text-to-audio", model="facebook/musicgen-small", framework="pt")
        forward_params = {
            "do_sample": False,
            "max_new_tokens": 250,
        }
-        outputs = speech_generator("This is a test", forward_params=forward_params)
+        outputs = music_generator("This is a test", forward_params=forward_params)
-        # musicgen sampling_rate is not straightforward to get
+        self.assertEqual({"audio": ANY(np.ndarray), "sampling_rate": 32000}, outputs)
-        self.assertIsNone(outputs["sampling_rate"])
-        audio = outputs["audio"]
-        self.assertEqual(ANY(np.ndarray), audio)
        # test two examples side-by-side
-        outputs = speech_generator(["This is a test", "This is a second test"], forward_params=forward_params)
+        outputs = music_generator(["This is a test", "This is a second test"], forward_params=forward_params)
        audio = [output["audio"] for output in outputs]
        self.assertEqual([ANY(np.ndarray), ANY(np.ndarray)], audio)
        # test batching
-        outputs = speech_generator(
+        outputs = music_generator(
            ["This is a test", "This is a second test"], forward_params=forward_params, batch_size=2
        )
-        self.assertEqual(ANY(np.ndarray), outputs[0]["audio"])
+        audio = [output["audio"] for output in outputs]
+        self.assertEqual([ANY(np.ndarray), ANY(np.ndarray)], audio)
    @slow
    @require_torch
-    def test_large_model_pt(self):
+    def test_small_bark_pt(self):
        speech_generator = pipeline(task="text-to-audio", model="suno/bark-small", framework="pt")
        forward_params = {