First add

d3dd8642 · Rayyyyy · d3dd8642 · d3dd8642 · d3dd8642 · d3dd8642
Commit d3dd8642 authored Jun 26, 2024 by Rayyyyy
20 changed files
--- a/docs/checkpoint_convert_me_to_hf.md
+++ b/docs/checkpoint_convert_me_to_hf.md
+
+
+
+
+
+### <font color=#FFC125 >源2.0-MoE 模型</font> 
+
+-----
+**ckpt转换说明**
+### <strong>🔘 ckpt转换</strong> 
+
+我们提供的的模型文件是8路流水并行（8pp）的模型文件，我们提供了自动转换脚本，可以依次执行完转换流程，使用方式如下：
+
+
+
+**<font color=#FFFFF0 >如果提前将8路流水并行合并，可以直接执行： </font>**
+
+
+```sh
+bash examples/convert_hf_moe.sh
+```
+
+在转换时需要
+
+
+**<font color=#FFFFF0 >如果不合并流水，可以按下面的方式进行转换： </font>**
+
+首先执行转换脚本：
+
+```sh
+bash examples/convert_hf_moe.sh
+```
+执行这个脚本，每一路流水对应的.ckpt文件都会生成一个对应的.bin文件，等完成转换之后可以删除这些中间文件。
+
+然后执行下面的命令：
+
+```sh
+python tools/concat.py --input-path $input_path --output-path $output_path --pp_rank 8 --num_layers 24 
+```
+
+这里的`--input-path`设置为上一步中产生的中间文件路径，这个命令会在`--output-path`设置的路径下生成一个完整的.bin文件。
+
+
+### <strong>🔘 bin文件拆分</strong> 
+执行上面的转换命令后会生成一个bin文件，可以执行下面的命令将其拆分：
+```sh
+python tools/split_bin.py --input-path $input_path --output-path $output_path
+```
+
+### <strong>🔘 HF模型推理</strong> 
+
+可以通过如下代码调用YuanMoE模型来生成文本： 
+
+```python
+import torch, transformers
+import sys, os
+sys.path.append(
+    os.path.abspath(os.path.join(os.path.dirname(__file__), os.path.pardir)))
+from transformers import AutoModelForCausalLM,AutoTokenizer,LlamaTokenizer
+
+print("Creat tokenizer...")
+tokenizer = LlamaTokenizer.from_pretrained('IEITYuan/Yuan2-hf-moe', add_eos_token=False, add_bos_token=False, eos_token='<eod>')
+tokenizer.add_tokens(['<sep>', '<pad>', '<mask>', '<predict>', '<FIM_SUFFIX>', '<FIM_PREFIX>', '<FIM_MIDDLE>','<commit_before>','<commit_msg>','<commit_after>','<jupyter_start>','<jupyter_text>','<jupyter_code>','<jupyter_output>','<empty_output>'], special_tokens=True)
+
+print("Creat model...")
+model = AutoModelForCausalLM.from_pretrained('IEITYuan/Yuan2-hf-moe', device_map='auto', torch_dtype=torch.bfloat16, trust_remote_code=True)
+
+inputs = tokenizer("请问目前最先进的机器学习算法有哪些？", return_tensors="pt")["input_ids"].to("cuda:0")
+outputs = model.generate(inputs,do_sample=False,max_length=100)
+print(tokenizer.decode(outputs[0]))
+```
--- a/docs/checkpoint_process.md
+++ b/docs/checkpoint_process.md
--- a/docs/data_process.md
+++ b/docs/data_process.md
--- a/docs/data_process_cn.md
+++ b/docs/data_process_cn.md
--- a/docs/distrib_optimizer.md
+++ b/docs/distrib_optimizer.md
--- a/docs/eval_arc.md
+++ b/docs/eval_arc.md
--- a/docs/eval_arc_cn.md
+++ b/docs/eval_arc_cn.md
+# eval_arc
+
+## 数据集
+**`datasets/ARC/ARC_challenge.txt`.** ARC_challenge测试集，共包含2344个选择题。
+
+其中，“[SEP]”之前的内容是原始问题，“[SEP]”之后的内容是该问题的标准答案。
+
+## 评测
+
+### 说明
+**`examples/eval_arc_2x32B.sh`.** 运行该程序即可获得模型在ARC_challenge数据集上的推理结果。
+
+代码中的变量设置如下：
+
+| 变量名            | 解释          |
+| ------------------- | --------------------------------------------- |
+| `CHECKPOINT_PATH`    | 待评测checkpoint的路径 |
+| `TOKENIZER_MODEL_PATH` | tokenizer的路径          |
+| `MATH_DATA`    | 待测试数据集的路径       |
+| `OUTPUT_PATH`    | 推理结果的保存路径         |
+
+### 运行
+
+运行以下命令获得推理结果：
+```
+bash -x examples/eval_arc_2x32B.sh
+```
+
+### 结果
+评测结果将保存在 `OUTPUT_PATH`中。其中，“[SEP]”之前的内容为原始问题，“[SEP]”之后的内容是模型对该问题的解析。
+
+## 准确率
+### 说明
+**`tasks/ARC/score_arc.py`.** 运行该程序即可获得ARC_challenge评测结果的准确率。
+
+代码中的变量设置如下：
+
+| 变量名称               | 说明          |
+| ------------------- | --------------------------------------------- |
+| `origin_file_path`  | 测试集的保存路径               |
+| `eval_file_path`    | 评测结果文件的保存路径       |
+| `txt_eval_res_dir`  | 准确率评判结果的保存路径，以"true"结尾的文件中为正确结果，以"false"结尾的文件中为错误结果。 |
+
+### 运行
+执行以下命令以评估模型在测试集上的准确率：
+```
+python score_arc.py
+```
+### 结果
+“Number of correct answers”和“Number of incorrect answers”分别表示回答正确答案数和回答错误答案数，“accuracy”表示准确率。
+
--- a/docs/eval_gsm8k.md
+++ b/docs/eval_gsm8k.md
--- a/docs/eval_gsm8k_cn.md
+++ b/docs/eval_gsm8k_cn.md
--- a/docs/eval_humaneval.md
+++ b/docs/eval_humaneval.md
--- a/docs/eval_humaneval_cn.md
+++ b/docs/eval_humaneval_cn.md
--- a/docs/eval_math.md
+++ b/docs/eval_math.md
--- a/docs/eval_math_cn.md
+++ b/docs/eval_math_cn.md
--- a/docs/eval_mmlu.md
+++ b/docs/eval_mmlu.md
--- a/docs/eval_mmlu_cn.md
+++ b/docs/eval_mmlu_cn.md
--- a/docs/images/distrib_optimizer/data_flow.png
+++ b/docs/images/distrib_optimizer/data_flow.png
--- a/docs/images/distrib_optimizer/sharding_scheme.png
+++ b/docs/images/distrib_optimizer/sharding_scheme.png
--- a/docs/inference_server.md
+++ b/docs/inference_server.md
--- a/docs/inference_server_cn.md
+++ b/docs/inference_server_cn.md
--- a/docs/instruct_tuning.md
+++ b/docs/instruct_tuning.md