For IterableDataset, return DataLoader using self._train_batch_size. … (#21447)

For IterableDataset, return DataLoader using self._train_batch_size. This is consistent with how we generate a regular DataLoader, and leads to the correct args.per_device_train_batch_size eventually ending up on each GPU.

For IterableDataset, return DataLoader using self._train_batch_size. … (#21447)
For IterableDataset, return DataLoader using self._train_batch_size. This is consistent with how we generate a regular DataLoader, and leads to the correct args.per_device_train_batch_size eventually ending up on each GPU.
31c351c4 · agossard · GitHub · 833174c9 · 31c351c4
Unverified Commit 31c351c4 authored Feb 03, 2023 by agossard Committed by GitHub Feb 03, 2023
Hide whitespace changes
Inline Side-by-side

Showing with 1 addition and 1 deletion

src/transformers/trainer.py src/transformers/trainer.py +1 -1

No files found.
--- a/src/transformers/trainer.py
+++ b/src/transformers/trainer.py
@@ -868,7 +868,7 @@ class Trainer:
            return DataLoader(
                train_dataset,
-                batch_size=self.args.per_device_train_batch_size,
+                batch_size=self._train_batch_size,
                collate_fn=data_collator,
                num_workers=self.args.dataloader_num_workers,
                pin_memory=self.args.dataloader_pin_memory,