pretrain_bert.py · 69a546be21cef5e72000295275a23cb7491d26cc · OpenDAS / Megatron-LM

Refactor code according to Jared's comments: move pipelining and... · 1979c242

Deepak Narayanan authored Nov 12, 2020

Refactor code according to Jared's comments: move pipelining and non-pipelining training loops into separate methods

Also, use mpu.get_*_model_parallel_size() instead of args.*_model_parallel_size

1979c242

pretrain_bert.py 5.19 KB

Replace pretrain_bert.py