megatron patch

950d42b4 · dongcl · 4e2de453 · 950d42b4
Commit 950d42b4 authored Mar 26, 2025 by dongcl
Hide whitespace changes
Inline Side-by-side

Showing with 3 additions and 2 deletions

dcu_megatron/adaptor/megatron_adaptor.py dcu_megatron/adaptor/megatron_adaptor.py +3 -2

No files found.
--- a/dcu_megatron/adaptor/megatron_adaptor.py
+++ b/dcu_megatron/adaptor/megatron_adaptor.py
@@ -110,7 +110,7 @@ class CoreAdaptation(MegatronAdaptationABC):
    def patch_core_transformers(self):
        from ..core import transformer_block_init_wrapper, transformer_block_forward
        from ..core.transformer.transformer_config import TransformerConfig, MLATransformerConfig
-
+        
        # Transformer block
        MegatronAdaptation.register('megatron.core.transformer.transformer_block.TransformerBlock.__init__',
                                    transformer_block_init_wrapper)
@@ -141,7 +141,8 @@ class CoreAdaptation(MegatronAdaptationABC):
    def patch_core_extentions(self):
        import transformer_engine as te

-        from ..core.extensions.transformer_engine import te_dot_product_attention_init, TEGroupedLinear
+        from ..core.extensions.transformer_engine import te_dot_product_attention_init
+        from megatron.core.extensions.transformer_engine import TEGroupedLinear

        MegatronAdaptation.register('megatron.core.extensions.transformer_engine.TEDotProductAttention.__init__',
                                    te_dot_product_attention_init)