[BugFix] Fix fsdp option on shard_grad_op. (#19131)

da6a1b6c · Zhong Hui · GitHub · 9e957066 · da6a1b6c
Unverified Commit da6a1b6c authored Sep 21, 2022 by Zhong Hui Committed by GitHub Sep 21, 2022
Show whitespace changes
Inline Side-by-side

Showing with 1 addition and 1 deletion

src/transformers/training_args.py src/transformers/training_args.py +1 -1

No files found.
--- a/src/transformers/training_args.py
+++ b/src/transformers/training_args.py
@@ -1197,7 +1197,7 @@ class TrainingArguments:
                "`--fsdp offload` can't work on its own. It needs to be added to `--fsdp full_shard` or "
                '`--fsdp shard_grad_op`. For example, `--fsdp "full_shard offload"`.'
            )
-        elif FSDPOption.FULL_SHARD in self.fsdp and FSDPOption.SHARD_GRAD_OP in self.sharded_ddp:
+        elif FSDPOption.FULL_SHARD in self.fsdp and FSDPOption.SHARD_GRAD_OP in self.fsdp:
            raise ValueError("`--fsdp full_shard` is not compatible with `--fsdp shard_grad_op`.")

        if len(self.fsdp) == 0 and self.fsdp_min_num_params > 0: