README.md 776 Bytes
Newer Older
hepj's avatar
hepj committed
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
参考网址https://github.com/kimiyoung/transformer-xl

# 1.数据准备

数据集下载地址:http://mattmahoney.net/dc/enwik8.zip

数据处理:在enwik8.zip同一文件夹下

```
python3 prep_enwik8.py
```

# 2.数据转换

1.修改enwik8_base_gpu.sh脚本中DATA_ROOT为数据路径

2.执行

```
bash ./scripts/enwik8_base_gpu.sh train_data
```

# 3.模型运行

```
#单卡运行
bash ./scripts/enwik8_base1_gpu.sh train
#多卡运行
bash scripts/enwik8_base_gpu.sh
```

# 4.重要参数说明

```
enwik8_base_gpu.sh & enwik8_base1_gpu.sh
--MODEL_DIR   --模型保存位置
--NUM_CORE    --为使用GPU数量,
--BSZ         --batchs_size(注意使用数据转化是使用的BSZ和训练使用的BSZ需要保持一致)
--TRAIN_STEPS --训练步数
```