Add `input_context` to `input_fn` in cifar10_main. (#6414)

* Add `input_context` to `input_fn` in cifar10_main. * Change sharding log message to be consistent with `dataset.shard` params. * Lint

Add `input_context` to `input_fn` in cifar10_main. (#6414)
* Add `input_context` to `input_fn` in cifar10_main. * Change sharding log message to be consistent with `dataset.shard` params. * Lint
721cd512 · Ayush Dubey · GitHub · 7b5606a5 · 721cd512 · 721cd512
Unverified Commit 721cd512 authored Mar 20, 2019 by Ayush Dubey Committed by GitHub Mar 20, 2019
Show whitespace changes
Inline Side-by-side

Showing with 21 additions and 6 deletions

official/resnet/cifar10_main.py official/resnet/cifar10_main.py +18 -3

official/resnet/imagenet_main.py official/resnet/imagenet_main.py +3 -3

No files found.
--- a/official/resnet/cifar10_main.py
+++ b/official/resnet/cifar10_main.py
@@ -107,9 +107,15 @@ def preprocess_image(image, is_training):
  return image


-def input_fn(is_training, data_dir, batch_size, num_epochs=1,
-             dtype=tf.float32, datasets_num_private_threads=None,
-             num_parallel_batches=1, parse_record_fn=parse_record):
+def input_fn(is_training,
+             data_dir,
+             batch_size,
+             num_epochs=1,
+             dtype=tf.float32,
+             datasets_num_private_threads=None,
+             num_parallel_batches=1,
+             parse_record_fn=parse_record,
+             input_context=None):
  """Input function which provides batches for train or eval.

  Args:
@@ -121,6 +127,8 @@ def input_fn(is_training, data_dir, batch_size, num_epochs=1,
    datasets_num_private_threads: Number of private threads for tf.data.
    num_parallel_batches: Number of parallel batches for tf.data.
    parse_record_fn: Function to use for parsing the records.
+    input_context: A `tf.distribute.InputContext` object passed in by
+      `tf.distribute.Strategy`.

  Returns:
    A dataset that can be used for iteration.
@@ -128,6 +136,13 @@ def input_fn(is_training, data_dir, batch_size, num_epochs=1,
  filenames = get_filenames(is_training, data_dir)
  dataset = tf.data.FixedLengthRecordDataset(filenames, _RECORD_BYTES)

+  if input_context:
+    tf.compat.v1.logging.info(
+        'Sharding the dataset: input_pipeline_id=%d num_input_pipelines=%d' % (
+            input_context.input_pipeline_id, input_context.num_input_pipelines))
+    dataset = dataset.shard(input_context.num_input_pipelines,
+                            input_context.input_pipeline_id)
+
  return resnet_run_loop.process_record_dataset(
      dataset=dataset,
      is_training=is_training,

--- a/official/resnet/imagenet_main.py
+++ b/official/resnet/imagenet_main.py
@@ -189,9 +189,9 @@ def input_fn(is_training,
  dataset = tf.data.Dataset.from_tensor_slices(filenames)

  if input_context:
-    tf.compat.v1.logging.info('Sharding the dataset %d/%d' % (
-        (input_context.input_pipeline_id + 1),
-        input_context.num_input_pipelines))
+    tf.compat.v1.logging.info(
+        'Sharding the dataset: input_pipeline_id=%d num_input_pipelines=%d' % (
+            input_context.input_pipeline_id, input_context.num_input_pipelines))
    dataset = dataset.shard(input_context.num_input_pipelines,
                            input_context.input_pipeline_id)