Merge pull request #1 from huggingface/multi-gpu-support

Create DataParallel model if several GPUs

Merge pull request #1 from huggingface/multi-gpu-support
Create DataParallel model if several GPUs
a6efe123 · VictorSanh · GitHub · 5889765a · 5f432480 · a6efe123
Unverified Commit a6efe123 authored Nov 03, 2018 by VictorSanh Committed by GitHub Nov 03, 2018
Hide whitespace changes
Inline Side-by-side

Showing with 9 additions and 0 deletions

extract_features_pytorch.py extract_features_pytorch.py +3 -0

run_classifier_pytorch.py run_classifier_pytorch.py +3 -0

run_squad_pytorch.py run_squad_pytorch.py +3 -0

No files found.
--- a/extract_features_pytorch.py
+++ b/extract_features_pytorch.py
@@ -249,6 +249,9 @@ def main():
    if args.init_checkpoint is not None:
        model.load_state_dict(torch.load(args.init_checkpoint, map_location='cpu'))
    model.to(device)
+    if n_gpu > 1:
+        model = nn.DataParallel(model)
    all_input_ids = torch.tensor([f.input_ids for f in features], dtype=torch.long)
    all_input_mask = torch.tensor([f.input_mask for f in features], dtype=torch.long)

--- a/run_classifier_pytorch.py
+++ b/run_classifier_pytorch.py
@@ -482,6 +482,9 @@ def main():
    if args.init_checkpoint is not None:
        model.bert.load_state_dict(torch.load(args.init_checkpoint, map_location='cpu'))
    model.to(device)
+    if n_gpu > 1:
+        model = torch.nn.DataParallel(model)
    optimizer = BERTAdam([{'params': [p for n, p in model.named_parameters() if n != 'bias'], 'l2': 0.01},
                          {'params': [p for n, p in model.named_parameters() if n == 'bias'], 'l2': 0.}

--- a/run_squad_pytorch.py
+++ b/run_squad_pytorch.py
@@ -795,6 +795,9 @@ def main():
    if args.init_checkpoint is not None:
        model.bert.load_state_dict(torch.load(args.init_checkpoint, map_location='cpu'))
    model.to(device)
+    if n_gpu > 1:
+        model = torch.nn.DataParallel(model)
    optimizer = BERTAdam([{'params': [p for n, p in model.named_parameters() if n != 'bias'], 'l2': 0.01},
                          {'params': [p for n, p in model.named_parameters() if n == 'bias'], 'l2': 0.}