fixed the bug raised by "tmp_eval_loss += tmp_eval_loss.item()" when parallelly using multi-gpu.

bd847ce7 · focox@qq.com · ef1b8b2a · bd847ce7
Commit bd847ce7 authored Oct 23, 2019 by focox@qq.com
Show whitespace changes
Inline Side-by-side

Showing with 3 additions and 0 deletions

examples/run_ner.py examples/run_ner.py +3 -0

No files found.
--- a/examples/run_ner.py
+++ b/examples/run_ner.py
@@ -210,6 +210,9 @@ def evaluate(args, model, tokenizer, labels, pad_token_label_id, mode, prefix=""
            outputs = model(**inputs)
            tmp_eval_loss, logits = outputs[:2]

+            if args.n_gpu > 1:
+                tmp_eval_loss = tmp_eval_loss.mean()  # mean() to average on multi-gpu parallel evaluating
+
            eval_loss += tmp_eval_loss.item()
        nb_eval_steps += 1
        if preds is None: