Merge branch '更新GNMT测试结果' into 'main'

更新了GNMTv2测试结果 See merge request dcutoolkit/deeplearing/dlexamples_new!12

Merge branch '更新GNMT测试结果' into 'main'
更新了GNMTv2测试结果 See merge request dcutoolkit/deeplearing/dlexamples_new!12
c8d118bc · huchen · aeaee61d · 6a57493a · c8d118bc
Commit c8d118bc authored Apr 24, 2022 by huchen
Hide whitespace changes
Inline Side-by-side

Showing with 17 additions and 16 deletions

PyTorch/NLP/gnmt/README.md PyTorch/NLP/gnmt/README.md +17 -16

No files found.
--- a/PyTorch/NLP/gnmt/README.md
+++ b/PyTorch/NLP/gnmt/README.md
@@ -36,20 +36,20 @@ python3 setup.py install
 + 下载[mosedecoder](https://github.com/moses-smt/mosesdecoder)工具
 + 使用**mosedecoder**将**newstest2016**等数据集转换为原始txt格式
 + 使用**mosedecoder**中的**tokenizer**分词器将语料进行分词
-+ 清洗所有语料（copora）
-+ 做BPE
+ 清洗所有语料
+ 做**BPE**

 ### 2. 数据集预处理
 此部分已经整合到**train.py**中

 ### 3. 修改训练脚本
-修改训练脚本**`run_fp32_singleCard.sh`**内的参数：
+修改训练脚本**run_fp32_singleCard.sh**内的参数：
 ```
-GPUS： 使用几张GPU卡 
-TRAIN_BATCH_SIZE：批大小
-NUMEPOCHS: 代数
-TRAIN_SEQ_LEN： 最大句子长度
-MATH: 精度
+--GPUS：               GPU卡数
+--TRAIN_BATCH_SIZE：   批大小
+--NUMEPOCHS:           代数
+--TRAIN_SEQ_LEN：      最大句子长度
+--MATH:                精度
 ```
 ### 4. 执行训练
 ```
@@ -57,11 +57,12 @@ bash run_fp32_singleCard.sh
 ```

 ### 5. 测试结果
-| 卡数 | 精度 | bs | 测试结果 | NV卡对比 |
-| :---: | :---: | :---: | :---:     | :---: |
-| 1     | FP32  | 64    | 11650     |       |
-| 1     | FP32  | 128   | 14220     | 21860 |
-| 1     | FP16  | 128   | 11500     |       |
-| 4     | FP32  | 64    | 8521 * 4  |       |
-| 4     | FP32  | 128   | 11225 * 4 | 80224 |
-| 4     | FP16  | 128   | 10692 * 4 |       |
+| 卡数 | 精度 | bs | 测试结果 | NV卡对比 | 显存占用 |
+|:---:|:---:|:---:|:---:|:---:|:---:|
+| 1 | FP32 | 64 | 11332 | | 54% | 
+| 1 | FP32 | 128 | 14025 | 21860 | 80% |
+| 1 | FP16 | 128 | 11404 | | 58% |
+| 1 | FP16 | 256 | 13584 | | 97% |
+| 4 | FP32 | 64 | 9784 * 4 | | 66% |
+| 4 | FP32 | 128 | 12495 * 4 | 80224 | 92% |
+| 4 | FP16 | 128 | 10937 * 4 | | 71% |