[Examples] Generalise run audio classification for log-mel models (#21756)

* [Examples] Generalise run audio classification for log-mel models * batch feature extractor * make style

[Examples] Generalise run audio classification for log-mel models (#21756)
* [Examples] Generalise run audio classification for log-mel models * batch feature extractor * make style
13489248 · Sanchit Gandhi · GitHub · f7ca656f · 13489248
Unverified Commit 13489248 authored Feb 24, 2023 by Sanchit Gandhi Committed by GitHub Feb 24, 2023
Hide whitespace changes
Inline Side-by-side

Showing with 9 additions and 6 deletions

examples/pytorch/audio-classification/run_audio_classification.py .../pytorch/audio-classification/run_audio_classification.py +9 -6

No files found.
--- a/examples/pytorch/audio-classification/run_audio_classification.py
+++ b/examples/pytorch/audio-classification/run_audio_classification.py
@@ -289,24 +289,27 @@ def main():
        data_args.audio_column_name, datasets.features.Audio(sampling_rate=feature_extractor.sampling_rate)
    )
+    model_input_name = feature_extractor.model_input_names[0]
    def train_transforms(batch):
        """Apply train_transforms across a batch."""
-        output_batch = {"input_values": []}
+        subsampled_wavs = []
        for audio in batch[data_args.audio_column_name]:
            wav = random_subsample(
                audio["array"], max_length=data_args.max_length_seconds, sample_rate=feature_extractor.sampling_rate
            )
-            output_batch["input_values"].append(wav)
+            subsampled_wavs.append(wav)
+        inputs = feature_extractor(subsampled_wavs, sampling_rate=feature_extractor.sampling_rate)
+        output_batch = {model_input_name: inputs.get(model_input_name)}
        output_batch["labels"] = list(batch[data_args.label_column_name])
        return output_batch
    def val_transforms(batch):
        """Apply val_transforms across a batch."""
-        output_batch = {"input_values": []}
+        wavs = [audio["array"] for audio in batch[data_args.audio_column_name]]
-        for audio in batch[data_args.audio_column_name]:
+        inputs = feature_extractor(wavs, sampling_rate=feature_extractor.sampling_rate)
-            wav = audio["array"]
+        output_batch = {model_input_name: inputs.get(model_input_name)}
-            output_batch["input_values"].append(wav)
        output_batch["labels"] = list(batch[data_args.label_column_name])
        return output_batch