Update multi_dcu_train.py

57fe5c63 · wanglch · 3d7eb65b · 57fe5c63
Commit 57fe5c63 authored May 21, 2024 by wanglch
Hide whitespace changes
Inline Side-by-side

Showing with 2 additions and 2 deletions

multi_dcu_train.py multi_dcu_train.py +2 -2

No files found.
--- a/multi_dcu_train.py
+++ b/multi_dcu_train.py
@@ -81,7 +81,7 @@ def train_loop(dataloader, model, optimizer, lr_scheduler, epoch, total_loss):
    model.train()
    for batch, batch_data in enumerate(dataloader, start=1):
-        batch_data = batch_data.to(device)
+        batch_data = {k: v.to(device) for k, v in batch_data.items()}
        outputs = model(**batch_data)
        loss = outputs.loss
        loss = loss.mean()
@@ -101,7 +101,7 @@ def test_loop(dataloader, model):
    model.eval()
    for batch_data in tqdm(dataloader):
-        batch_data = batch_data.to(device)
+        batch_data = {k: v.to(device) for k, v in batch_data.items()}
        with torch.no_grad():
            # 如果你使用了 DataParallel，你可以通过访问 model.module 来获取原始模型
            generated_tokens = model.module.generate(