[chatgpt]fix train_rm bug with lora (#2741)

648183a9 · BlueRum · GitHub · b6e3b955 · 648183a9
Unverified Commit 648183a9 authored Feb 16, 2023 by BlueRum Committed by GitHub Feb 16, 2023
Hide whitespace changes
Inline Side-by-side

Showing with 1 addition and 1 deletion

applications/ChatGPT/chatgpt/trainer/rm.py applications/ChatGPT/chatgpt/trainer/rm.py +1 -1

No files found.
--- a/applications/ChatGPT/chatgpt/trainer/rm.py
+++ b/applications/ChatGPT/chatgpt/trainer/rm.py
@@ -43,7 +43,7 @@ class RewardModelTrainer(ABC):
            # train
            if use_lora > 0:
                print("Using Lora")
-                lora.mark_only_lora_as_trainable(self.model)
+                lora.mark_only_lora_as_trainable(self.model.model)
            else:
                self.model.train()
            for chosen_ids, c_mask, reject_ids, r_mask in self.train_dataloader: