fix batch_size in transformer_main.py (#4897)

* fix batch_size in transformer_main.py fix batch_size in transformer_main.py which causes ResourceExhaustedError: OOM during training Transformer models using models/official/transformer * small format change change format from one line to multiple ones in order to pass lint tests * remove trailing space and add comment

fix batch_size in transformer_main.py (#4897)
* fix batch_size in transformer_main.py fix batch_size in transformer_main.py which causes ResourceExhaustedError: OOM during training Transformer models using models/official/transformer * small format change change format from one line to multiple ones in order to pass lint tests * remove trailing space and add comment
2d7a0d6a · Jiang Yu · Taylor Robie · c1588f00 · 2d7a0d6a
Commit 2d7a0d6a authored Jul 25, 2018 by Jiang Yu Committed by Taylor Robie Jul 25, 2018
Hide whitespace changes
Inline Side-by-side

Showing with 6 additions and 3 deletions

official/transformer/transformer_main.py official/transformer/transformer_main.py +6 -3

No files found.
--- a/official/transformer/transformer_main.py
+++ b/official/transformer/transformer_main.py
@@ -555,9 +555,12 @@ def run_transformer(flags_obj):

  params["use_synthetic_data"] = flags_obj.use_synthetic_data

-  # Set batch size parameter, which depends on TPU and distribution settings.
-  params["batch_size"] = (
-      flags_obj.batch_size or params["default_batch_size_tpu"])
+  # Set batch size parameter, which depends on the availability of
+  # TPU and GPU, and distribution settings.
+  params["batch_size"] = (flags_obj.batch_size or (
+      params["default_batch_size_tpu"] if params["use_tpu"]
+      else params["default_batch_size"]))
+
  if not params["use_tpu"]:
    params["batch_size"] = distribution_utils.per_device_batch_size(
        params["batch_size"], num_gpus)