Update language_model.py, 添加torch.compile

945e5b94 · wxj · 99a0c39e · 945e5b94
Commit 945e5b94 authored Dec 31, 2024 by wxj
Show whitespace changes
Inline Side-by-side

Showing with 4 additions and 0 deletions

megatron/legacy/model/language_model.py megatron/legacy/model/language_model.py +4 -0

No files found.
--- a/megatron/legacy/model/language_model.py
+++ b/megatron/legacy/model/language_model.py
@@ -15,6 +15,9 @@ from .module import MegatronModule
 from .transformer import ParallelTransformer
 from .utils import get_linear_layer, init_method_normal, scaled_init_method_normal
+import torch._dynamo
+torch._dynamo.config.suppress_errors = True
 def parallel_lm_logits(input_, word_embeddings_weight, parallel_output, bias=None):
    """LM logits using word embedding weights."""
@@ -468,6 +471,7 @@ class TransformerLanguageModel(MegatronModule):
        else:
            raise Exception('Stage must have at least either encoder or decoder')
+    @torch.compile(mode="max-autotune-no-cudagraphs")
    def forward(
        self,
        enc_input_ids,