Modify README and dockerfile

ac652aac · Rayyyyy · d461441a · ac652aac · ac652aac · ac652aac
Commit ac652aac authored Jun 18, 2024 by Rayyyyy
6 changed files
--- a/Contributors.md
+++ b/Contributors.md
+# Contributors
+None
\ No newline at end of file
--- a/README.md
+++ b/README.md
@@ -3,20 +3,19 @@
 [Images Speak in Images: A Generalist Painter for In-Context Visual Learning](https://arxiv.org/abs/2212.02499)
 ## 模型结构
+整个模型基于VIT系列的骨干，VIT的backbone由encoder、decoder两部分组成, 编码器是由VIT的骨干block堆积而成，解码器其实是卷积层构成的。
 <div align=center>
    <img src="./doc/method.png"/>
 </div>
 ## 算法原理
-将视觉任务的连续输出空间离散化, 并使用语言或专门设计的离散标记作为任务提示, 将视觉问题转化为 NLP 问题.
+通用视觉模型 Painter , 将“以视觉为中心”作为建模核心思想，将图像作为输入和输出，从而获得上下文视觉信息，完成不同的视觉任务。将视觉任务的连续输出空间离散化, 并使用语言或专门设计的离散标记作为任务提示, 将视觉问题转化为 NLP 问题。
 <div align=center>
    <img src="./doc/progress.png"/>
 </div>
 ## 环境配置
-Tips: timm==0.3.2 版本存在 [cannot import name 'container_abcs' from 'torch._six'](https://github.com/huggingface/pytorch-image-models/issues/420#issuecomment-776459842) 问题, 需要将 timm/models/layers/helpers.py 中 from torch._six import container_abcs 修改为
+Tips: timm==0.3.2 版本存在 [cannot import name 'container_abcs' from 'torch._six'](https://github.com/huggingface/pytorch-image-models/issues/420#issuecomment-776459842) 问题, 需要将 `timm/models/layers/helpers.py` 中 `from torch._six import container_abcs` 修改为
 ```bash
 import torch
@@ -30,7 +29,6 @@ else:
 ```
 ### Docker（方法一）
 -v 路径、docker_name和imageID根据实际情况修改
 ```bash
@@ -46,7 +44,6 @@ python -m pip install -e detectron2
 ```
 ### Dockerfile（方法二）
 -v 路径、docker_name和imageID根据实际情况修改
 ```bash
@@ -87,10 +84,9 @@ python -m pip install -e detectron2
 ```
 ## 数据集
-本项目所需数据集较多, 所以提供了项目数据集需求较多, 可以使用提供的[a toy training dataset](https://huggingface.co/BAAI/Painter/blob/main/toy_datasets.tar)数据集来验证部分功能, 数据集由每个类别中各10个类别组成. 将数据集放置于 `$Painter_ROOT/toy_datasets` 路径下, 并设置`$Painter_ROOT/train_painter_vit_large.sh` 中 `DATA_PATH=toy_datasets`即可, 其他参数请参考训练章节的介绍.
+本项目所需数据集较多, 可以使用提供的[a toy training dataset](https://huggingface.co/BAAI/Painter/blob/main/toy_datasets.tar)数据集来验证部分功能, 数据集由每个类别中各10个类别组成. 将数据集放置于 `$Painter_ROOT/toy_datasets` 路径下, 并设置`$Painter_ROOT/train_painter_vit_large.sh` 中 `DATA_PATH=toy_datasets`即可, 其他参数请参考训练章节的介绍。
-如需完整数据集, 请参考[data instructions](docs/DATA.md).
-完整数据集的目录结构如下：
+如需完整数据集, 请参考[data instructions](docs/DATA.md)。完整数据集的目录结构如下：
 ```
 ├── nyu_depth_v2/
@@ -202,31 +198,27 @@ bash run_train_multi.sh
 各个数据集推理方法如下:
 ### NYU Depth V2
+设置 `$Painter_ROOT/eval/nyuv2_depth/eval.sh` 文件里的 `JOB_NAME`、`PROMPT`、`CKPT_FILE` 和 `DATA_DIR` 参数，执行：
-设置 `$Painter_ROOT/eval/nyuv2_depth/eval.sh` 文件里的 `JOB_NAME`、`PROMPT`、`CKPT_FILE` 和 `DATA_DIR` 参数:
 ```bash
 bash eval/nyuv2_depth/eval.sh
 ```
 ### ADE20k Semantic Segmentation
+1. **无法使用 toy_datasets 进行验证**;
-1. 无法使用toy_datasets进行验证;
 2. 设置 `$Painter_ROOT/eval/ade20k_semantic/eval.sh` 文件里的 `JOB_NAME`、`PROMPT` 参数, 执行下面的命令:
 ```bash
 bash eval/ade20k_semantic/eval.sh
 ```
 ### COCO Panoptic Segmentation
+1. **无法使用 toy_datasets 进行验证**;
-1. 无法使用toy_datasets进行验证;
 2. 设置 `$Painter_ROOT/eval/coco_panoptic/eval.sh` 文件里的 `JOB_NAME`、`PROMPT` 参数, 然后执行下面的命令:
 ```bash
 bash eval/coco_panoptic/eval.sh
 ```
 ### COCO Human Pose Estimation
+1. **无法使用 toy_datasets 进行验证**;
-1. 无法使用toy_datasets进行验证;
 2. 生成验证所需的图像:
 ```bash
 python -m torch.distributed.launch --nproc_per_node=4 --master_port=29500 --use_env eval/mmpose_custom/painter_inference_pose.py --ckpt_path models/painter_vit_large/painter_vit_large.pth
@@ -240,8 +232,6 @@ cd $Painter_ROOT/eval/mmpose_custom
 ```
 ### Low-Light Image Enhancement
-执行
 ```bash
 python eval/lol/painter_inference_lol.py --ckpt_path models/path/of/painter_vit_large.pth --data_dir path/of/datasets
@@ -250,24 +240,20 @@ python eval/lol/painter_inference_lol.py --ckpt_path models/painter_vit_large.pt
 ```
 ## result
+三张图从左到右分别为: 原始图像, 低分辨率图像, 经模型超分处理后的图像。
-三张图从左到右分别为: 原始图像, 低分辨率图像, 经模型超分处理后的图像.
 <div align=center>
    <img src="./doc/high.png"/>
    <img src="./doc/low.png"/>
    <img src="./doc/results.png"/>
 </div>
 ### 精度
 基于项目提供的测试数据, 得到单卡测试结果如下：
-| enhance | datasets | PSNR | SSIM |
+| device | task | datasets | PSNR | SSIM |
-| :------: | :------: | :------: | :------: |
+| :------: | :------: | :------: | :------: | :------: |
-| ours | LOL | 22.34 | 0.8716 |
+| Z100L | enhance | LOL | 22.34 | 0.8716 |
-| paper | LOL | 22.34 | 0.872 |
+| paper | enhance | LOL | 22.34 | 0.872 |
 ## 应用场景
 ### 算法类别

--- a/docker/Dockerfile
+++ b/docker/Dockerfile
 FROM image.sourcefind.cn:5000/dcu/admin/base/pytorch:1.13.1-centos7.6-dtk-23.04.1-py38-latest
-RUN source /opt/dtk/env.sh
-COPY requirements.txt requirements.txt
-RUN pip3 install -r requirements.txt
--- a/toy_datasets/coco/.DS_Store
+++ b/toy_datasets/coco/.DS_Store
--- a/toy_datasets/coco/._.DS_Store
+++ b/toy_datasets/coco/._.DS_Store
--- a/train.sh
+++ b/train.sh
@@ -6,8 +6,6 @@ export USE_MIOPEN_BATCHNORM=1
 DATA_PATH=/home/datasets
 name=painter_vit_large
 python -m torch.distributed.launch --nproc_per_node=4 \
-	--nnodes=${WORLD_SIZE} --node_rank=$RANK \
-	--master_addr=$MASTER_ADDR --master_port=12358 \
 	--use_env main_train.py  \
    --batch_size 2 \
    --accum_iter 16  \