"git@developer.sourcefind.cn:cnjsdfcy/simbricks.git" did not exist on "ced8b8d141709741b03af7d6ffe44650c656efe7"
Commit e156bfe1 authored by wanglch's avatar wanglch
Browse files

Update README.md

parent f3aee530
...@@ -28,7 +28,7 @@ MiniCPM 是面壁智能与清华大学自然语言处理实验室共同开源的 ...@@ -28,7 +28,7 @@ MiniCPM 是面壁智能与清华大学自然语言处理实验室共同开源的
[光源](https://www.sourcefind.cn/#/service-details)拉取docker镜像的地址与使用步骤 [光源](https://www.sourcefind.cn/#/service-details)拉取docker镜像的地址与使用步骤
``` ```
docker pull image.sourcefind.cn:5000/dcu/admin/base/pytorch:2.1.0-ubuntu20.04-dtk24.04.1-py310 docker pull image.sourcefind.cn:5000/dcu/admin/base/pytorch:2.3.0-ubuntu22.04-dtk24.04.3-py310
docker run -it -v /path/your_code_data/:/path/your_code_data/ -v /opt/hyhal/:/opt/hyhal/:ro --shm-size=64G --privileged=true --device=/dev/kfd --device=/dev/dri/ --group-add video --name minicpm-v <your imageID> bash docker run -it -v /path/your_code_data/:/path/your_code_data/ -v /opt/hyhal/:/opt/hyhal/:ro --shm-size=64G --privileged=true --device=/dev/kfd --device=/dev/dri/ --group-add video --name minicpm-v <your imageID> bash
...@@ -49,11 +49,11 @@ docker run --shm-size=64G --name minicpm-v -v /opt/hyhal:/opt/hyhal:ro --privile ...@@ -49,11 +49,11 @@ docker run --shm-size=64G --name minicpm-v -v /opt/hyhal:/opt/hyhal:ro --privile
关于本项目DCU显卡所需的特殊深度学习库可从[光合](https://developer.hpccube.com/tool/)开发者社区下载安装。 关于本项目DCU显卡所需的特殊深度学习库可从[光合](https://developer.hpccube.com/tool/)开发者社区下载安装。
``` ```
DTK驱动:dtk23.10 DTK驱动:dtk24.04.03
python:python3.10 python:python3.10
torch:2.1 torch:2.3
torchvision: 0.16.0 torchvision: 0.18.
deepspped: 0.12.3 deepspped: 0.14.2
``` ```
`Tips:以上dtk驱动、python、paddle等DCU相关工具版本需要严格一一对应` `Tips:以上dtk驱动、python、paddle等DCU相关工具版本需要严格一一对应`
...@@ -70,7 +70,7 @@ pip install -r requirements.txt -i http://mirrors.aliyun.com/pypi/simple ...@@ -70,7 +70,7 @@ pip install -r requirements.txt -i http://mirrors.aliyun.com/pypi/simple
## 数据集 ## 数据集
迷你数据集 [self_build](data/self_build/) 迷你数据集 [self_build](data/self_build/) 需要将对应json文件中的路径改为本地路径
本仓库提供自建数据集用于训练代码测试。预训练需要准备你的训练数据,需要将所有样本放到一个列表中并存入json文件中。每个样本对应一个字典,示例如下所示。用于正常训练的完整数据集请按此目录结构进行制备: 本仓库提供自建数据集用于训练代码测试。预训练需要准备你的训练数据,需要将所有样本放到一个列表中并存入json文件中。每个样本对应一个字典,示例如下所示。用于正常训练的完整数据集请按此目录结构进行制备:
...@@ -109,11 +109,11 @@ pip install -r requirements.txt -i http://mirrors.aliyun.com/pypi/simple ...@@ -109,11 +109,11 @@ pip install -r requirements.txt -i http://mirrors.aliyun.com/pypi/simple
``` ```
## 训练 ## 训练
训练需将finetune文件夹中的[finetune_lora.sh](./finetune/finetune_lora.sh)中修改以下参数 训练需将finetune文件夹中的[finetune_lora.sh](./finetune/finetune_ds.sh)中修改以下参数
``` ```
MODEL="openbmb/MiniCPM-Llama3-V-2_5" # or 修改为本地模型地址 MODEL="XXXXXX/MiniCPM-Llama3-V-2_5" # or 修改为本地模型地址
DATA="path/to/trainging_data" # 本地自定义训练集json文件 DATA="data/self_build/" # 本地自定义训练集json文件
EVAL_DATA="path/to/test_data" # 本地自定义验证集json文件 EVAL_DATA="data/self_build/" # 本地自定义验证集json文件
--output_dir /home/wanglch/projects/saves/MiniCPM-Llama3-V-2_5/lora_train_dtk \ --output_dir /home/wanglch/projects/saves/MiniCPM-Llama3-V-2_5/lora_train_dtk \
--logging_dir /home/wanglch/projects/saves/MiniCPM-Llama3-V-2_5/lora_train_dtk \ --logging_dir /home/wanglch/projects/saves/MiniCPM-Llama3-V-2_5/lora_train_dtk \
...@@ -123,7 +123,7 @@ EVAL_DATA="path/to/test_data" # 本地自定义验证集json文件 ...@@ -123,7 +123,7 @@ EVAL_DATA="path/to/test_data" # 本地自定义验证集json文件
``` ```
cd finetune cd finetune
sh finetune_lora.sh sh finetune_ds.sh
``` ```
## 推理 ## 推理
......
Markdown is supported
0% or .
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment