更换dtk24.04.1镜像

3be647c6 · dcuai · 5bc9e4fb · 3be647c6
Commit 3be647c6 authored Sep 09, 2024 by dcuai
Hide whitespace changes
Inline Side-by-side

Showing with 11 additions and 14 deletions

README.md README.md +11 -14

No files found.
--- a/README.md
+++ b/README.md
@@ -57,8 +57,8 @@
 ### Docker（方法一）
-    docker pull image.sourcefind.cn:5000/dcu/admin/base/pytorch:1.13.1-centos7.6-dtk-23.04.1-py39-latest
+    docker pull image.sourcefind.cn:5000/dcu/admin/base/pytorch:2.1.0-ubuntu20.04-dtk24.04.1-py3.10
-    docker run --shm-size 10g --network=host --name=stylegan3 --privileged --device=/dev/kfd --device=/dev/dri --group-add video --cap-add=SYS_PTRACE --security-opt seccomp=unconfined -v 项目地址(绝对路径):/home/ -it <your IMAGE ID> bash
+    docker run --shm-size 10g --network=host --name=stylegan3 --privileged --device=/dev/kfd --device=/dev/dri --group-add video --cap-add=SYS_PTRACE --security-opt seccomp=unconfined -v 项目地址(绝对路径):/home/ -v /opt/hyhal:/opt/hyhal -it <your IMAGE ID> bash
    pip install -r requirements.txt
 ### Docker（方法二）
@@ -66,20 +66,20 @@
    # 需要在对应的目录下
    docker build -t <IMAGE_NAME>:<TAG> .
    # <your IMAGE ID>用以上拉取的docker的镜像ID替换
-    docker run -it --shm-size 10g --network=host --name=stylegan3 --privileged --device=/dev/kfd --device=/dev/dri --group-add video --cap-add=SYS_PTRACE --security-opt seccomp=unconfined <your IMAGE ID> bash
+    docker run -it --shm-size 10g --network=host -v /opt/hyhal:/opt/hyhal --name=stylegan3 --privileged --device=/dev/kfd --device=/dev/dri --group-add video --cap-add=SYS_PTRACE --security-opt seccomp=unconfined <your IMAGE ID> bash
    pip install -r requirements.txt
 ### Anaconda (方法三)
 1、关于本项目DCU显卡所需的特殊深度学习库可从光合开发者社区下载安装：
 https://developer.hpccube.com/tool/
-    DTK驱动：dtk23.04.1
+    DTK驱动：dtk24.04.1
-    python：python3.9
+    python：python3.10
-    torch:1.13.1
+    torch:2.1
-    torchvision:0.14.1
+    torchvision:0.16.1
-    torchaudio:0.13.1
+    torchaudio:2.1.2
-    deepspeed:0.9.2
+    deepspeed:0.12.3
-    apex:0.1
+    apex:1.1.0
 Tips：以上dtk驱动、python、torch等DCU相关工具版本需要严格一一对应
@@ -142,10 +142,7 @@ pretrained_models/
    --gpus=4 --batch=8 --gamma=8.2 --mirror=1 --mbstd-group=2
    # 微调
-    #例:预训练的FFHQ-U pickle开始，微调MetFaces-U的StyleGAN3-R
+    python train.py --outdir=training-runs --cfg=stylegan3-r --data=datasets/afhqv2-512x512.zip --gpus=1 --batch=1 --gamma=6.6 --mirror=1 --mbstd-group=1 --kimg=5000 --snap=5 --resume=stylegan3-r-afhqv2-512x512.pkl
-    python train.py --outdir=training-runs --cfg=stylegan3-r --data=datasets/metfacesu-1024x1024.zip \
-    --gpus=4 --batch=8 --gamma=6.6 --mirror=1 --mbstd-group=2 --kimg=5000 --snap=5 \
-    --resume=https://api.ngc.nvidia.com/v2/models/nvidia/research/stylegan3/versions/1/files/stylegan3-r-ffhqu-1024x1024.pkl
 注意：必须显式指定最重要的选项(`--gpu`、`--batch`和`--gamma`)，并且应该谨慎设置，请参阅`python train.py --help`，以获得完整的选项列表和一般指南和建议的训练配置，以及不同场景下预期的训练速度和内存使用情况。