IterableDatasetShard should use per device batch size instead of real batch size (#14714)

17efc806 · charon____ · GitHub · 2a56edb3 · 17efc806
Unverified Commit 17efc806 authored Dec 22, 2021 by charon____ Committed by GitHub Dec 22, 2021
Show whitespace changes
Inline Side-by-side

Showing with 2 additions and 2 deletions

src/transformers/trainer.py src/transformers/trainer.py +2 -2

No files found.
--- a/src/transformers/trainer.py
+++ b/src/transformers/trainer.py
@@ -653,7 +653,7 @@ class Trainer:

            return DataLoader(
                train_dataset,
-                batch_size=self.args.train_batch_size,
+                batch_size=self.args.per_device_train_batch_size,
                collate_fn=self.data_collator,
                num_workers=self.args.dataloader_num_workers,
                pin_memory=self.args.dataloader_pin_memory,
@@ -722,7 +722,7 @@ class Trainer:
            if self.args.world_size > 1:
                eval_dataset = IterableDatasetShard(
                    eval_dataset,
-                    batch_size=self.args.eval_batch_size,
+                    batch_size=self.args.per_device_eval_batch_size,
                    drop_last=self.args.dataloader_drop_last,
                    num_processes=self.args.world_size,
                    process_index=self.args.process_index,