Commit 3be647c6 authored by dcuai's avatar dcuai
Browse files

更换dtk24.04.1镜像

parent 5bc9e4fb
...@@ -57,8 +57,8 @@ ...@@ -57,8 +57,8 @@
### Docker(方法一) ### Docker(方法一)
docker pull image.sourcefind.cn:5000/dcu/admin/base/pytorch:1.13.1-centos7.6-dtk-23.04.1-py39-latest docker pull image.sourcefind.cn:5000/dcu/admin/base/pytorch:2.1.0-ubuntu20.04-dtk24.04.1-py3.10
docker run --shm-size 10g --network=host --name=stylegan3 --privileged --device=/dev/kfd --device=/dev/dri --group-add video --cap-add=SYS_PTRACE --security-opt seccomp=unconfined -v 项目地址(绝对路径):/home/ -it <your IMAGE ID> bash docker run --shm-size 10g --network=host --name=stylegan3 --privileged --device=/dev/kfd --device=/dev/dri --group-add video --cap-add=SYS_PTRACE --security-opt seccomp=unconfined -v 项目地址(绝对路径):/home/ -v /opt/hyhal:/opt/hyhal -it <your IMAGE ID> bash
pip install -r requirements.txt pip install -r requirements.txt
### Docker(方法二) ### Docker(方法二)
...@@ -66,20 +66,20 @@ ...@@ -66,20 +66,20 @@
# 需要在对应的目录下 # 需要在对应的目录下
docker build -t <IMAGE_NAME>:<TAG> . docker build -t <IMAGE_NAME>:<TAG> .
# <your IMAGE ID>用以上拉取的docker的镜像ID替换 # <your IMAGE ID>用以上拉取的docker的镜像ID替换
docker run -it --shm-size 10g --network=host --name=stylegan3 --privileged --device=/dev/kfd --device=/dev/dri --group-add video --cap-add=SYS_PTRACE --security-opt seccomp=unconfined <your IMAGE ID> bash docker run -it --shm-size 10g --network=host -v /opt/hyhal:/opt/hyhal --name=stylegan3 --privileged --device=/dev/kfd --device=/dev/dri --group-add video --cap-add=SYS_PTRACE --security-opt seccomp=unconfined <your IMAGE ID> bash
pip install -r requirements.txt pip install -r requirements.txt
### Anaconda (方法三) ### Anaconda (方法三)
1、关于本项目DCU显卡所需的特殊深度学习库可从光合开发者社区下载安装: 1、关于本项目DCU显卡所需的特殊深度学习库可从光合开发者社区下载安装:
https://developer.hpccube.com/tool/ https://developer.hpccube.com/tool/
DTK驱动:dtk23.04.1 DTK驱动:dtk24.04.1
python:python3.9 python:python3.10
torch:1.13.1 torch:2.1
torchvision:0.14.1 torchvision:0.16.1
torchaudio:0.13.1 torchaudio:2.1.2
deepspeed:0.9.2 deepspeed:0.12.3
apex:0.1 apex:1.1.0
Tips:以上dtk驱动、python、torch等DCU相关工具版本需要严格一一对应 Tips:以上dtk驱动、python、torch等DCU相关工具版本需要严格一一对应
...@@ -142,10 +142,7 @@ pretrained_models/ ...@@ -142,10 +142,7 @@ pretrained_models/
--gpus=4 --batch=8 --gamma=8.2 --mirror=1 --mbstd-group=2 --gpus=4 --batch=8 --gamma=8.2 --mirror=1 --mbstd-group=2
# 微调 # 微调
#例:预训练的FFHQ-U pickle开始,微调MetFaces-U的StyleGAN3-R python train.py --outdir=training-runs --cfg=stylegan3-r --data=datasets/afhqv2-512x512.zip --gpus=1 --batch=1 --gamma=6.6 --mirror=1 --mbstd-group=1 --kimg=5000 --snap=5 --resume=stylegan3-r-afhqv2-512x512.pkl
python train.py --outdir=training-runs --cfg=stylegan3-r --data=datasets/metfacesu-1024x1024.zip \
--gpus=4 --batch=8 --gamma=6.6 --mirror=1 --mbstd-group=2 --kimg=5000 --snap=5 \
--resume=https://api.ngc.nvidia.com/v2/models/nvidia/research/stylegan3/versions/1/files/stylegan3-r-ffhqu-1024x1024.pkl
注意:必须显式指定最重要的选项(`--gpu``--batch``--gamma`),并且应该谨慎设置,请参阅`python train.py --help`,以获得完整的选项列表和一般指南和建议的训练配置,以及不同场景下预期的训练速度和内存使用情况。 注意:必须显式指定最重要的选项(`--gpu``--batch``--gamma`),并且应该谨慎设置,请参阅`python train.py --help`,以获得完整的选项列表和一般指南和建议的训练配置,以及不同场景下预期的训练速度和内存使用情况。
......
Markdown is supported
0% or .
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment