Skip to content
GitLab
Menu
Projects
Groups
Snippets
Loading...
Help
Help
Support
Community forum
Keyboard shortcuts
?
Submit feedback
Contribute to GitLab
Sign in / Register
Toggle navigation
Menu
Open sidebar
evt_fugx1
dcu_megatron
Commits
3e3515a7
Commit
3e3515a7
authored
May 23, 2025
by
wxj
Browse files
Update README.md
parent
9be97c01
Changes
1
Hide whitespace changes
Inline
Side-by-side
Showing
1 changed file
with
14 additions
and
2 deletions
+14
-2
README.md
README.md
+14
-2
No files found.
README.md
View file @
3e3515a7
# Dcu Megatron
# Dcu Megatron
## 项目介绍
本项目通过替换megatron的函数或类,引入新的特性或者实现更好的性能。替换的函数或类注册在dcu_megatron/adaptor/megatron_adaptor.py。
本项目通过替换megatron的函数或类,引入新的特性或者实现更好的性能。替换的函数或类注册在dcu_megatron/adaptor/megatron_adaptor.py。
+
支持函数替换
+
支持函数替换
...
@@ -70,7 +70,19 @@ def unpermute(
...
@@ -70,7 +70,19 @@ def unpermute(
在tp场景下,用户可以选择使用flux通算融合算子,获得更好的训练和推理性能。项目通过替换transformer engine方法集成flux,使用时需要设置环境变量USE_FLUX_OVERLAP=1,并设置transformer-impl为transformer_engine。
在tp场景下,用户可以选择使用flux通算融合算子,获得更好的训练和推理性能。项目通过替换transformer engine方法集成flux,使用时需要设置环境变量USE_FLUX_OVERLAP=1,并设置transformer-impl为transformer_engine。
### 使用方式
## 使用方式
### 项目下载
1.
git方式下载
1.
1 使用git clone下载项目后
1.
2 cd Megatron-LM
1.
3 git submodule update --init --recursive
2.
离线下载
2.
1 离线下载该仓库的离线代码包
2.
2 点击Megatron-LM@版本号, 下载对应版本的Megatron-LM离线代码包
2.
3 将Megatron-LM离线代码包解压到dcu_megatron目录下的Megatron-LM目录
### 项目使用
在使用时,进入到examples目录下,有相关模型执行脚本,所用数据集请自行下载:https://r0ddbu55vzx.feishu.cn/drive/folder/ZxHHfCoX4lg75td2hTqcmiAin3g
在使用时,进入到examples目录下,有相关模型执行脚本,所用数据集请自行下载:https://r0ddbu55vzx.feishu.cn/drive/folder/ZxHHfCoX4lg75td2hTqcmiAin3g
```
```
examples/
examples/
...
...
Write
Preview
Markdown
is supported
0%
Try again
or
attach a new file
.
Attach a file
Cancel
You are about to add
0
people
to the discussion. Proceed with caution.
Finish editing this message first!
Cancel
Please
register
or
sign in
to comment