# MMPretrain-MMCV ## 环境配置 ### Docker(方法一) 推荐使用docker方式运行,拉取提供的docker镜像 ```shell docker pull image.sourcefind.cn:5000/dcu/admin/base/pytorch:2.1.0-ubuntu20.04-dtk24.04.1-py3.10 ``` 基于拉取的镜像创建容器 ```shell # 用以上拉取的docker的镜像ID或名称替换 docker run -it --name=mobilenetv2 --network=host --ipc=host --shm-size=16g --device=/dev/kfd --device=/dev/dri --device=/dev/mkfd --group-add video --privileged --cap-add=SYS_PTRACE --security-opt seccomp=unconfined -v /opt/hyhal:/opt/hyhal:ro -v $PWD/mobilenetv2_mmcv:/home/mobilenetv2_mmcv bash ``` 克隆git仓库,并安装相关依赖 ```shell git clone http://developer.hpccube.com/codes/OpenDAS/mmpretrain-mmcv.git cd mmpretrain-mmcv pip install -e . pip install -r requirements.txt ``` ### Dockerfile(方法二) cd mmpretrain/docker docker build --no-cache -t mmpretrain:latest . docker run -it --name=mmpretrain --network=host --ipc=host --shm-size=16g --device=/dev/kfd --device=/dev/dri --device=/dev/mkfd --group-add video --privileged --cap-add=SYS_PTRACE --security-opt seccomp=unconfined -v /opt/hyhal:/opt/hyhal:ro -v $PWD/mmpretrain:/home/mmpretrain bash pip install -e . # 若遇到Dockerfile启动的方式安装环境需要长时间等待,可注释掉里面的pip安装,启动容器后再安装python库: pip install -r requirements.txt ### Anaconda(方法三) 1、关于本项目DCU显卡所需的特殊深度学习库可从光合开发者社区下载安装: https://developer.hpccube.com/tool/ ```shell DTK驱动: DTK-24.04.1 python==3.10 torch==2.1.0 torchvision==0.16.0+das1.1.git7d45932.abi1.dtk2404.torch2.1 mmcv==2.0.1+das1.1.gite58da25.abi1.dtk2404.torch2.1.0 ``` Tips:以上dtk驱动、python、torch等DCU相关工具版本需要严格一一对应 2、安装mmpretrain仓库源码 ```shell cd mmpretrain-mmcv pip install -e . ``` 3、其它非特殊库参照requirements.txt安装 ```shell pip install -r requirements.txt ``` ## 示例 本仓库中提供了几个在tiny imagenet下进行测试的脚本 如用8卡从零开始训练resnet50的运行方式如下, ```shell bash tools/dist_train.sh resnet50-test.py 8 ``` 更多的配置在configs目录下,均可通过以下方式运行 ```shell bash tools/dist_train.sh <配置文件脚本> <训练用卡数> ```