Commit 3be647c6 authored by dcuai's avatar dcuai
Browse files

更换dtk24.04.1镜像

parent 5bc9e4fb
......@@ -57,8 +57,8 @@
### Docker(方法一)
docker pull image.sourcefind.cn:5000/dcu/admin/base/pytorch:1.13.1-centos7.6-dtk-23.04.1-py39-latest
docker run --shm-size 10g --network=host --name=stylegan3 --privileged --device=/dev/kfd --device=/dev/dri --group-add video --cap-add=SYS_PTRACE --security-opt seccomp=unconfined -v 项目地址(绝对路径):/home/ -it <your IMAGE ID> bash
docker pull image.sourcefind.cn:5000/dcu/admin/base/pytorch:2.1.0-ubuntu20.04-dtk24.04.1-py3.10
docker run --shm-size 10g --network=host --name=stylegan3 --privileged --device=/dev/kfd --device=/dev/dri --group-add video --cap-add=SYS_PTRACE --security-opt seccomp=unconfined -v 项目地址(绝对路径):/home/ -v /opt/hyhal:/opt/hyhal -it <your IMAGE ID> bash
pip install -r requirements.txt
### Docker(方法二)
......@@ -66,20 +66,20 @@
# 需要在对应的目录下
docker build -t <IMAGE_NAME>:<TAG> .
# <your IMAGE ID>用以上拉取的docker的镜像ID替换
docker run -it --shm-size 10g --network=host --name=stylegan3 --privileged --device=/dev/kfd --device=/dev/dri --group-add video --cap-add=SYS_PTRACE --security-opt seccomp=unconfined <your IMAGE ID> bash
docker run -it --shm-size 10g --network=host -v /opt/hyhal:/opt/hyhal --name=stylegan3 --privileged --device=/dev/kfd --device=/dev/dri --group-add video --cap-add=SYS_PTRACE --security-opt seccomp=unconfined <your IMAGE ID> bash
pip install -r requirements.txt
### Anaconda (方法三)
1、关于本项目DCU显卡所需的特殊深度学习库可从光合开发者社区下载安装:
https://developer.hpccube.com/tool/
DTK驱动:dtk23.04.1
python:python3.9
torch:1.13.1
torchvision:0.14.1
torchaudio:0.13.1
deepspeed:0.9.2
apex:0.1
DTK驱动:dtk24.04.1
python:python3.10
torch:2.1
torchvision:0.16.1
torchaudio:2.1.2
deepspeed:0.12.3
apex:1.1.0
Tips:以上dtk驱动、python、torch等DCU相关工具版本需要严格一一对应
......@@ -142,10 +142,7 @@ pretrained_models/
--gpus=4 --batch=8 --gamma=8.2 --mirror=1 --mbstd-group=2
# 微调
#例:预训练的FFHQ-U pickle开始,微调MetFaces-U的StyleGAN3-R
python train.py --outdir=training-runs --cfg=stylegan3-r --data=datasets/metfacesu-1024x1024.zip \
--gpus=4 --batch=8 --gamma=6.6 --mirror=1 --mbstd-group=2 --kimg=5000 --snap=5 \
--resume=https://api.ngc.nvidia.com/v2/models/nvidia/research/stylegan3/versions/1/files/stylegan3-r-ffhqu-1024x1024.pkl
python train.py --outdir=training-runs --cfg=stylegan3-r --data=datasets/afhqv2-512x512.zip --gpus=1 --batch=1 --gamma=6.6 --mirror=1 --mbstd-group=1 --kimg=5000 --snap=5 --resume=stylegan3-r-afhqv2-512x512.pkl
注意:必须显式指定最重要的选项(`--gpu``--batch``--gamma`),并且应该谨慎设置,请参阅`python train.py --help`,以获得完整的选项列表和一般指南和建议的训练配置,以及不同场景下预期的训练速度和内存使用情况。
......
Markdown is supported
0% or .
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment