"git@developer.sourcefind.cn:modelzoo/resnet50_tensorflow.git" did not exist on "d3258fe9f42b2f0e146a942c89afb95f9108498d"
Commit 527584c3 authored by wxj's avatar wxj
Browse files

Update README.md

parent 1a317380
Pipeline #2022 passed with stage
...@@ -71,7 +71,7 @@ python tools/preprocess_data.py \ ...@@ -71,7 +71,7 @@ python tools/preprocess_data.py \
# 参数说明 # 参数说明
# --input 输入数据集路径,即oscar-1GB.jsonl.xz解压后的文件路径 # --input 输入数据集路径,即oscar-1GB.jsonl.xz解压后的文件路径
# --output-prefix 输出数据路径,处理后会自动加上_text_document后缀 # --output-prefix 输出数据路径(需要输出目录已创建),处理后会自动加上_text_document后缀
# --vocab-file 下载的gpt2-vocab.json词表文件路径 # --vocab-file 下载的gpt2-vocab.json词表文件路径
# --tokenizer-type tokenizer类型 # --tokenizer-type tokenizer类型
# --merge-file 下载的gpt2-merges.txt文件路径 # --merge-file 下载的gpt2-merges.txt文件路径
......
Markdown is supported
0% or .
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment