Add icon and SCNET, update dtk

313dc12e · Rayyyyy · 953fd580 · 313dc12e · 313dc12e · 313dc12e
Commit 313dc12e authored Jul 09, 2024 by Rayyyyy
Show whitespace changes
Inline Side-by-side

Showing with 51 additions and 81 deletions

README.md README.md +50 -79

docker/Dockerfile docker/Dockerfile +1 -2

icon.png icon.png +0 -0

No files found.
--- a/README.md
+++ b/README.md
 # Real-ESRGAN
 ## 论文
-[Real-ESRGAN: Training Real-World Blind Super-Resolution with Pure Synthetic Data](https://arxiv.org/abs/2107.10833)
+`Real-ESRGAN: Training Real-World Blind Super-Resolution with Pure Synthetic Data`
+- https://arxiv.org/abs/2107.10833
 ## 模型结构
-生成网络: 采用ESRGAN的生成网络, 对于x4倍的超分辨, 网络完全按照ESRGAN的生成器执行；对x2和x1倍的超分辨, 网络先进行pixel-unshuffle（pixel-shuffl的反操作, pixel-shuffle可理解为通过压缩图像通道而对图像尺寸进行放大）, 以降低图像分辨率为前提, 对图像通道数进行扩充, 然后将处理后的图像输入网络进行超分辨重建。
+生成网络: 采用ESRGAN的生成网络，对于x4倍的超分辨，网络完全按照ESRGAN的生成器执行；对x2和x1倍的超分辨，网络先进行pixel-unshuffle（pixel-shuffl的反操作，pixel-shuffle可理解为通过压缩图像通道而对图像尺寸进行放大），以降低图像分辨率为前提，对图像通道数进行扩充，然后将处理后的图像输入网络进行超分辨重建。
 <div align=center>
    <img src="./doc/ESRGAN.png"/>
 </div>
-对抗网络: 由于使用的复杂的构建数据集的方式, 所以需要使用更先进的判别器对生成图像进行判别。使用U-Net判别器可以在像素角度, 对单个生成的像素进行真假判断, 这能够在保证生成图像整体真实的情况下, 注重生成图像细节。
+对抗网络: 由于使用的复杂的构建数据集的方式，所以需要使用更先进的判别器对生成图像进行判别。使用U-Net判别器可以在像素角度，对单个生成的像素进行真假判断，这能够在保证生成图像整体真实的情况下，注重生成图像细节。
 <div align=center>
    <img src="./doc/UNet.png"/>
 </div>
 ## 算法原理
-通过使用更实用的退化过程合成训练对, 扩展强大的ESRGAN以恢复一般的真实世界LR图像。
+通过使用更实用的退化过程合成训练对，扩展强大的ESRGAN以恢复一般的真实世界LR图像。
 <div align=center>
    <img src="./doc/pipeline.png"/>
 </div>
@@ -25,9 +26,8 @@
 ### Docker（方法一）
 ```bash
-docker pull image.sourcefind.cn:5000/dcu/admin/base/pytorch:1.13.1-centos7.6-dtk-23.04.1-py38-latest
+docker pull image.sourcefind.cn:5000/dcu/admin/base/pytorch:2.1.0-centos7.6-dtk23.10.1-py38
+docker run -it -v /path/your_code_data/:/path/your_code_data/ -v /opt/hyhal/:/opt/hyhal/:ro --shm-size=32G --privileged=true --device=/dev/kfd --device=/dev/dri/ --group-add video --name docker_name imageID bash
-docker run -it -v /path/your_code_data/:/path/your_code_data/ --shm-size=32G --privileged=true --device=/dev/kfd --device=/dev/dri/ --group-add video --name docker_name imageID bash
 cd /your_code_path/real-esrgan_pytorch
 pip install -r requirements.txt
@@ -39,7 +39,7 @@ python setup.py develop
 cd ./docker
 docker build --no-cache -t real_esrgan:latest .
-docker run -it -v /path/your_code_data/:/path/your_code_data/ --shm-size=32G --privileged=true --device=/dev/kfd --device=/dev/dri/ --group-add video --name docker_name imageID bash
+docker run -it -v /path/your_code_data/:/path/your_code_data/ -v /opt/hyhal/:/opt/hyhal/:ro --shm-size=32G --privileged=true --device=/dev/kfd --device=/dev/dri/ --group-add video --name docker_name imageID bash
 cd /your_code_path/real-esrgan_pytorch
 pip install -r requirements.txt
@@ -51,13 +51,13 @@ python setup.py develop
 1、关于本项目DCU显卡所需的特殊深度学习库可从光合开发者社区下载安装: https://developer.hpccube.com/tool/
 ```bash
-DTK软件栈：dtk23.04.1
+DTK软件栈：dtk23.10.1
 python：python3.8
-torch：1.13.1
+torch：2.1.0
-torchvision：0.14.1
+torchvision：0.16.0
 ```
-Tips：以上dtk软件栈、python、torch等DCU相关工具版本需要严格一一对应
+`Tips：以上dtk软件栈、python、torch等DCU相关工具版本需要严格一一对应`
 2、其他非特殊库直接按照下面步骤进行安装
@@ -68,12 +68,11 @@ python setup.py develop
 ## 数据集
 ### 准备数据集
+所需数据集为: DF2K(DIV2K和Flickr2K) + OST，仅需要**HR**图片.
-所需数据集为: DF2K ( DIV2K 和 Flickr2K ) + OST. 仅需要 HR 图片.
+[DIV2K](http://113.200.138.88:18080/aidatasets/project-dependency/div2k/-/blob/master/DIV2K_train_HR.zip)
-[DIV2K](http://data.vision.ee.ethz.ch/cvl/DIV2K/DIV2K_train_HR.zip)
-[Flickr2K](https://cv.snu.ac.kr/research/EDSR/Flickr2K.tar)
+[Flickr2K](http://113.200.138.88:18080/aidatasets/project-dependency/flickr2k/-/blob/master/Flickr2K.tar)
 [OST](https://openmmlab.oss-cn-hangzhou.aliyuncs.com/datasets/OST_dataset.zip)
@@ -104,15 +103,15 @@ python gen_20k_val.py --root_path /path/of/ADE20K_2021_17_01 --save_path dataset
 │   ├── ADE20K_val # 生成的
 ```
-Tips: 项目提供了tiny_datasets进行快速上手测试, 如需使用tiny_datasets, 下面的数据路径需进行对应修改。
+Tips: 项目提供了`tiny_datasets`进行快速上手测试，如需使用`tiny_datasets`，下面的数据路径需进行对应修改。
 ### 预处理数据集
 #### 1.【可选】生成多尺寸图片
-如果只想简单试试而不进行准确训练, 那么该过程可选。
+如果只想简单试试而不进行准确训练，那么该过程可选。
-针对 DF2K 数据集, 我们使用多尺寸缩放策略,对 HR 图像进行下采样, 获得多尺寸的标准参考（Ground-Truth）图像。
+针对`DF2K`数据集，我们使用多尺寸缩放策略，对`HR`图像进行下采样，获得多尺寸的标准参考（Ground-Truth）图像。
-使用 [scripts/generate_multiscale_DF2K.py](scripts/generate_multiscale_DF2K.py) 脚本快速生成多尺寸的图像。
+使用 [scripts/generate_multiscale_DF2K.py](scripts/generate_multiscale_DF2K.py)脚本快速生成多尺寸的图像。
 ```bash
 # example
@@ -120,9 +119,9 @@ python scripts/generate_multiscale_DF2K.py --input datasets/DF2K/DF2K_HR --outpu
 ```
 #### 2.【可选】裁切为子图像
-如果你的 IO 够好或储存空间有限, 那么此步骤是可选的。
+如果你的IO够好或储存空间有限，那么此步骤是可选的。
-使用[scripts/extract_subimages.py](scripts/extract_subimages.py) 将 DF2K 图像裁切为子图像, 以加快 IO 和处理速度。
+使用[scripts/extract_subimages.py](scripts/extract_subimages.py)将`DF2K`图像裁切为子图像，以加快IO和处理速度。
 ```bash
 # example
@@ -130,9 +129,9 @@ python scripts/extract_subimages.py --input datasets/DF2K/DF2K_HR --output datas
 ```
 #### 3. 准备元信息 txt
-1. 使用 [scripts/generate_meta_info.py](scripts/generate_meta_info.py) 生成包含图像路径的 txt 文件。
+1. 使用 [scripts/generate_meta_info.py](scripts/generate_meta_info.py) 生成包含图像路径的`txt`文件。
-2. 还可以合并多个文件夹的图像路径到一个元信息（meta_info）txt, 示例参考如下:
+2. 还可以合并多个文件夹的图像路径到一个元信息（meta_info）txt，示例参考如下:
 ```bash
 # meta_info.txt 内容示例
@@ -140,23 +139,20 @@ python scripts/extract_subimages.py --input datasets/DF2K/DF2K_HR --output datas
 # DF2K_HR_sub/000001_s002.png
 # DF2K_HR_sub/000001_s003.png
-python scripts/generate_meta_info.py --input datasets/DF2K/DF2K_HR, datasets/DF2K/DF2K_multiscale --root datasets/DF2K, datasets/DF2K --meta_info datasets/DF2K/meta_info/meta_info_DF2Kmultiscale.txt
+python scripts/generate_meta_info.py --input datasets/DF2K/DF2K_HR，datasets/DF2K/DF2K_multiscale --root datasets/DF2K，datasets/DF2K --meta_info datasets/DF2K/meta_info/meta_info_DF2Kmultiscale.txt
 ```
 ## 训练
 ### 完整训练
-完整训练分为两步，第一步训练得到Real-ESRNet, 在Real-ESRNet的基础上训练得到Real-ESRGAN。
+完整训练分为两步，第一步训练得到Real-ESRNet，在Real-ESRNet的基础上训练得到Real-ESRGAN。
 1. [训练Real-ESRNet](#训练Real-ESRNet)
 2. [训练Real-ESRGAN](#训练Real-ESRGAN)
 #### 训练Real-ESRNet
-1. 下载预训练模型 [ESRGAN](https://github.com/xinntao/Real-ESRGAN/releases/download/v0.1.1/ESRGAN_SRx4_DF2KOST_official-ff704c30.pth), 将模型放到 `experiments/pretrained_models`目录下。
+1. 下载预训练模型[ESRGAN](http://113.200.138.88:18080/aimodels/findsource-dependency/real-esrgan_pytorch/-/blob/main/ESRGAN_SRx4_DF2KOST_official-ff704c30.pth)，将模型放到`experiments/pretrained_models`目录下。
-```bash
-wget https://github.com/xinntao/Real-ESRGAN/releases/download/v0.1.1/ESRGAN_SRx4_DF2KOST_official-ff704c30.pth -P experiments/pretrained_models
-```
-2. 相应地修改 `options/train_realesrnet_x4plus.yml` 中的内容:
+2. 相应地修改`options/train_realesrnet_x4plus.yml`中的内容:
 ```yml
 train:
    name: DF2K+OST
@@ -167,9 +163,9 @@ train:
        type: disk
 ```
-如果需要指定预训练路径到其他文件, 请修改 `pretrain_network_g` 参数, 当前默认保存为`experiments/train_RealESRNetx4plus_1000k_B12G4_fromESRGAN/models/net_g_1000000.pth`。
+如果需要指定预训练路径到其他文件，请修改`pretrain_network_g`参数，当前默认保存为`experiments/train_RealESRNetx4plus_1000k_B12G4_fromESRGAN/models/net_g_1000000.pth`。
-3. 如果你想在训练过程中执行验证, 就取消注释这些内容并进行相应的修改：
+3. 如果你想在训练过程中执行验证，就取消注释这些内容并进行相应的修改：
 ```yml
    # 取消注释这些以进行验证
    # val:
@@ -189,7 +185,7 @@ train:
    #   save_img: True
    #   metrics:
-    #     psnr: # 指标名称, 可以是任意的
+    #     psnr: # 指标名称，可以是任意的
    #       type: calculate_psnr
    #       crop_border: 4
    #       test_y_channel: false
@@ -198,31 +194,20 @@ train:
 #### 训练Real-ESRGAN
 1. Real-ESRNet模型训练完成后，得到`experiments/train_RealESRNetx4plus_1000k_B12G4_fromESRGAN/models/net_g_1000000.pth`;
-2. 大多数修改与上面列出的类似, 相应地修改文件  `options/train_realesrgan_x4plus.yml` 中的内容. 如果需要指定其他文件的预训练路径, 请修改 `pretrain_network_g` 参数.
+2. 大多数修改与上面列出的类似，相应地修改文件`options/train_realesrgan_x4plus.yml`中的内容. 如果需要指定其他文件的预训练路径，请修改`pretrain_network_g`参数.
 ### 微调Real-ESRGAN
-你可以用自己的数据集微调Real-ESRGAN。一般地, 微调（Fine-Tune）程序可以分为两种类型:
+你可以用自己的数据集微调`Real-ESRGAN`。一般地，微调程序可以分为两种类型:
 1. [动态生成降级图像](#动态生成降级图像)
 2. [使用**已配对**的数据](#使用已配对的数据)
 #### 动态生成降级图像
+只需要高分辨率图像，在训练过程中，使用`Real-ESRGAN`描述的降级模型生成低质量图像。
-只需要高分辨率图像, 在训练过程中, 使用 Real-ESRGAN 描述的降级模型生成低质量图像。
+1. 下载预训练模型[RealESRGAN_x4plus.pth](http://113.200.138.88:18080/aimodels/findsource-dependency/real-esrgan_pytorch/-/blob/main/RealESRGAN_x4plus.pth)、[RealESRGAN_x4plus_netD.pth](http://113.200.138.88:18080/aimodels/findsource-dependency/real-esrgan_pytorch/-/blob/main/RealESRGAN_x4plus_netD.pth)到`experiments/pretrained_models`目录下；
-1. 下载预训练模型到 `experiments/pretrained_models` 目录下：
-    + *RealESRGAN_x4plus.pth*:
-        ```bash
-        wget https://github.com/xinntao/Real-ESRGAN/releases/download/v0.1.0/RealESRGAN_x4plus.pth -P experiments/pretrained_models
-        ```
-    + *RealESRGAN_x4plus_netD.pth*:
+2. 修改选项文件 [options/finetune_realesrgan_x4plus.yml](options/finetune_realesrgan_x4plus.yml)，特别是`datasets`部分：
-        ```bash
-        wget https://github.com/xinntao/Real-ESRGAN/releases/download/v0.2.2.3/RealESRGAN_x4plus_netD.pth -P experiments/pretrained_models
-        ```
-2. 修改选项文件 [options/finetune_realesrgan_x4plus.yml](options/finetune_realesrgan_x4plus.yml), 特别是 `datasets` 部分：
 ```yml
 train:
@@ -235,39 +220,27 @@ train:
 ```
 #### 使用已配对的数据
+你还可以用自己已经配对的数据微调`RealESRGAN`，这个过程更类似于微调`ESRGAN`。
-你还可以用自己已经配对的数据微调 RealESRGAN, 这个过程更类似于微调 ESRGAN。
+1. 数据准备:
-1. 数据准备
 假设你已经有两个文件夹（folder）:
- **gt folder**（标准参考, 高分辨率图像）：*datasets/DF2K/DIV2K_train_HR_sub*
+- **gt folder**（标准参考，高分辨率图像）：*datasets/DF2K/DIV2K_train_HR_sub*
- **lq folder**（低质量, 低分辨率图像）：*datasets/DF2K/DIV2K_train_LR_bicubic_X4_sub*
+- **lq folder**（低质量，低分辨率图像）：*datasets/DF2K/DIV2K_train_LR_bicubic_X4_sub*
-然后, 使用脚本 [scripts/generate_meta_info_pairdata.py](scripts/generate_meta_info_pairdata.py) 生成元信息（meta_info）txt 文件。
+然后，使用脚本 [scripts/generate_meta_info_pairdata.py](scripts/generate_meta_info_pairdata.py) 生成元信息（meta_info）txt 文件。
 ```bash
 python scripts/generate_meta_info_pairdata.py --input datasets/DF2K/DIV2K_train_HR_sub datasets/DF2K/DIV2K_train_LR_bicubic_X4_sub --meta_info datasets/DF2K/meta_info/meta_info_DIV2K_sub_pair.txt
 ```
-2. 下载预训练模型
+2. 下载所需预训练模型[RealESRGAN_x4plus.pth](http://113.200.138.88:18080/aimodels/findsource-dependency/real-esrgan_pytorch/-/blob/main/RealESRGAN_x4plus.pth)、[RealESRGAN_x4plus_netD.pth](http://113.200.138.88:18080/aimodels/findsource-dependency/real-esrgan_pytorch/-/blob/main/RealESRGAN_x4plus_netD.pth)到`experiments/pretrained_models`目录下。
-下载所需预训练模型到 `experiments/pretrained_models` 目录下。
- *RealESRGAN_x4plus.pth*:
-    ```bash
-    wget https://github.com/xinntao/Real-ESRGAN/releases/download/v0.1.0/RealESRGAN_x4plus.pth -P experiments/pretrained_models
-    ```
- *RealESRGAN_x4plus_netD.pth*:
-    ```bash
-    wget https://github.com/xinntao/Real-ESRGAN/releases/download/v0.2.2.3/RealESRGAN_x4plus_netD.pth -P experiments/pretrained_models
-    ```
 3. 微调准备
-修改 [options/finetune_realesrgan_x4plus_pairdata.yml](options/finetune_realesrgan_x4plus_pairdata.yml) 中的配置项, 特别是 `datasets` 部分：
+修改 [options/finetune_realesrgan_x4plus_pairdata.yml](options/finetune_realesrgan_x4plus_pairdata.yml)中的配置项，特别是`datasets`部分：
 ```yml
 train:
@@ -282,26 +255,24 @@ train:
 ### 训练命令
 #### 单机多卡
-默认auto_resume模式, 根据完整训练或者微调训练, 修改-opt参数对应的yml文件。当前默认为微调训练
+默认auto_resume模式，根据完整训练或者微调训练，修改-opt参数对应的yml文件。当前默认为微调训练
 ```bash
 bash train.sh
 ```
 #### 多机多卡
-使用多节点的情况下，需要将使用节点写入hostfile文件, 多节点每个节点一行, 例如: c1xxxxxx slots=4。
+使用多节点的情况下，需要将使用节点写入hostfile文件，多节点每个节点一行，例如: c1xxxxxx slots=4。
-默认auto_resume模式, 根据完整训练或者微调训练, 请修改`$REAL-ESRGAN_ROOT/single_process.sh`中CONFIG参数。
+默认`auto_resume`模式，根据完整训练或者微调训练，请修改[single_process.sh](./single_process.sh)中`CONFIG`参数。
 ```bash
 bash run_train_multi.sh
 ```
 ## 推理
-下载预训练模型[RealESRGAN_x4plus.pth](https://github.com/xinntao/Real-ESRGAN/releases/download/v0.1.0/RealESRGAN_x4plus.pth), 将其放入 weights 文件夹下, 测试结果默认保存在results文件夹下。
+下载预训练模型[RealESRGAN_x4plus.pth](http://113.200.138.88:18080/aimodels/findsource-dependency/real-esrgan_pytorch/-/blob/main/RealESRGAN_x4plus.pth)，将其放入`weights`文件夹下，测试结果默认保存在`results`文件夹下。
-```
+```bash
-# 下载预训练模型
-wget https://github.com/xinntao/Real-ESRGAN/releases/download/v0.1.0/RealESRGAN_x4plus.pth -P weights
 # 执行推理
 python inference_realesrgan.py -n RealESRGAN_x4plus -i inputs --face_enhance
 ```
@@ -314,7 +285,7 @@ Model: RealESRGAN_x4plus
 </div>
 ### 精度
-本项目基于ADE20K公开数据集的val数据进行效果验证，需先要对ADE20K val数据进行推理，得到推理后的结果（默认在results下）计算 `NIQE` 得分。
+本项目基于ADE20K公开数据集的val数据进行效果验证，需先要对`ADE20K val`数据进行推理，得到推理后的结果（默认在results下）计算 `NIQE` 得分。
 ```bash
 # 执行推理
@@ -335,7 +306,7 @@ python evalution.py --root_path results
 交通,政府,制造
 ## 源码仓库及问题反馈
-https://developer.hpccube.com/codes/modelzoo/real-esrgan_pytorch
+- https://developer.hpccube.com/codes/modelzoo/real-esrgan_pytorch
 ## 参考资料
-https://github.com/xinntao/Real-ESRGAN
+- https://github.com/xinntao/Real-ESRGAN
--- a/docker/Dockerfile
+++ b/docker/Dockerfile
-FROM image.sourcefind.cn:5000/dcu/admin/base/pytorch:1.13.1-centos7.6-dtk-23.04.1-py38-latest
+FROM image.sourcefind.cn:5000/dcu/admin/base/pytorch:2.1.0-centos7.6-dtk23.10.1-py38
-RUN source /opt/dtk/env.sh
--- a/icon.png
+++ b/icon.png