Commit 3e3515a7 authored by wxj's avatar wxj
Browse files

Update README.md

parent 9be97c01
# Dcu Megatron # Dcu Megatron
## 项目介绍
本项目通过替换megatron的函数或类,引入新的特性或者实现更好的性能。替换的函数或类注册在dcu_megatron/adaptor/megatron_adaptor.py。 本项目通过替换megatron的函数或类,引入新的特性或者实现更好的性能。替换的函数或类注册在dcu_megatron/adaptor/megatron_adaptor.py。
+ 支持函数替换 + 支持函数替换
...@@ -70,7 +70,19 @@ def unpermute( ...@@ -70,7 +70,19 @@ def unpermute(
在tp场景下,用户可以选择使用flux通算融合算子,获得更好的训练和推理性能。项目通过替换transformer engine方法集成flux,使用时需要设置环境变量USE_FLUX_OVERLAP=1,并设置transformer-impl为transformer_engine。 在tp场景下,用户可以选择使用flux通算融合算子,获得更好的训练和推理性能。项目通过替换transformer engine方法集成flux,使用时需要设置环境变量USE_FLUX_OVERLAP=1,并设置transformer-impl为transformer_engine。
### 使用方式 ## 使用方式
### 项目下载
1. git方式下载
1.1 使用git clone下载项目后
1.2 cd Megatron-LM
1.3 git submodule update --init --recursive
2. 离线下载
2.1 离线下载该仓库的离线代码包
2.2 点击Megatron-LM@版本号, 下载对应版本的Megatron-LM离线代码包
2.3 将Megatron-LM离线代码包解压到dcu_megatron目录下的Megatron-LM目录
### 项目使用
在使用时,进入到examples目录下,有相关模型执行脚本,所用数据集请自行下载:https://r0ddbu55vzx.feishu.cn/drive/folder/ZxHHfCoX4lg75td2hTqcmiAin3g 在使用时,进入到examples目录下,有相关模型执行脚本,所用数据集请自行下载:https://r0ddbu55vzx.feishu.cn/drive/folder/ZxHHfCoX4lg75td2hTqcmiAin3g
``` ```
examples/ examples/
......
Markdown is supported
0% or .
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment