Support FP16 during inference

930c9580 · Myle Ott · 9a88b71d · 930c9580 · 930c9580 · 930c9580
Commit 930c9580 authored Jun 19, 2018 by Myle Ott
Show whitespace changes
Inline Side-by-side

Showing with 8 additions and 5 deletions

eval_lm.py eval_lm.py +2 -0

fairseq/options.py fairseq/options.py +1 -2

generate.py generate.py +2 -0

interactive.py interactive.py +3 -3

No files found.
--- a/eval_lm.py
+++ b/eval_lm.py
@@ -35,6 +35,8 @@ def main(args):
    # Optimize ensemble for generation and set the source and dest dicts on the model (required by scorer)
    for model in models:
        model.make_generation_fast_()
+        if args.fp16:
+            model.half()
    itr = data.EpochBatchIterator(
        dataset=task.dataset(args.gen_subset),

--- a/fairseq/options.py
+++ b/fairseq/options.py
@@ -117,6 +117,7 @@ def get_parser(desc, default_task='translation'):
                        choices=['json', 'none', 'simple', 'tqdm'])
    parser.add_argument('--seed', default=1, type=int, metavar='N',
                        help='pseudo random number generator seed')
+    parser.add_argument('--fp16', action='store_true', help='use FP16')
    # Task definitions can be found under fairseq/tasks/
    parser.add_argument(
@@ -187,8 +188,6 @@ def add_optimization_args(parser):
                            ' (default is to normalize by number of tokens)')
    group.add_argument('--update-freq', default='1', metavar='N',
                       help='update parameters every N_i batches, when in epoch i')
-    group.add_argument('--fp16', action='store_true',
-                       help='use FP16 during training')
    # Optimizer definitions can be found under fairseq/optim/
    group.add_argument('--optimizer', default='nag', metavar='OPT',

--- a/generate.py
+++ b/generate.py
@@ -43,6 +43,8 @@ def main(args):
    # Optimize ensemble for generation
    for model in models:
        model.make_generation_fast_(beamable_mm_beam_size=None if args.no_beamable_mm else args.beam)
+        if args.fp16:
+            model.half()
    # Load alignment dictionary for unknown word replacement
    # (None if no unknown word replacement, empty if no path to align dictionary)

--- a/interactive.py
+++ b/interactive.py
@@ -82,9 +82,9 @@ def main(args):
    # Optimize ensemble for generation
    for model in models:
-        model.make_generation_fast_(
+        model.make_generation_fast_(beamable_mm_beam_size=None if args.no_beamable_mm else args.beam)
-            beamable_mm_beam_size=None if args.no_beamable_mm else args.beam,
+        if args.fp16:
-        )
+            model.half()
    # Initialize generator
    translator = SequenceGenerator(