Release v1.0.0rc3

Release v1.0.0rc3

Release v1.0.0rc3
bb204696 · Wenwei Zhang · GitHub · 14c5ded4 · dea954e5 · bb204696
Unverified Commit bb204696 authored Jun 14, 2022 by Wenwei Zhang Committed by GitHub Jun 14, 2022
20 changed files
--- a/docs/zh_cn/faq.md
+++ b/docs/zh_cn/faq.md
@@ -6,7 +6,7 @@
 - 如果您在 `import open3d` 时遇到下面的问题：
-  ``OSError: /lib/x86_64-linux-gnu/libm.so.6: version 'GLIBC_2.27' not found``
+  `OSError: /lib/x86_64-linux-gnu/libm.so.6: version 'GLIBC_2.27' not found`
  请将 open3d 的版本降级至 0.9.0.0，因为最新版 open3d 需要 'GLIBC_2.27' 文件的支持， Ubuntu 16.04 系统中缺失该文件，且该文件仅存在于 Ubuntu 18.04 及之后的系统中。
@@ -21,15 +21,15 @@
 - 如果您在导入 pycocotools 相关包时遇到下面的问题：
-  ``ValueError: numpy.ndarray size changed, may indicate binary incompatibility. Expected 88 from C header, got 80 from PyObject``
+  `ValueError: numpy.ndarray size changed, may indicate binary incompatibility. Expected 88 from C header, got 80 from PyObject`
-  请将 pycocotools 的版本降级至 2.0.1，这是由于最新版本的 pycocotools 与 numpy < 1.20.0 不兼容。或者通过下面的方式从源码进行编译来安装最新版本的 pycocotools ：
+  请将 pycocotools 的版本降级至 2.0.1，这是由于最新版本的 pycocotools 与 numpy \< 1.20.0 不兼容。或者通过下面的方式从源码进行编译来安装最新版本的 pycocotools ：
-  ``pip install -e "git+https://github.com/cocodataset/cocoapi#egg=pycocotools&subdirectory=PythonAPI"``
+  `pip install -e "git+https://github.com/cocodataset/cocoapi#egg=pycocotools&subdirectory=PythonAPI"`
  或者
-  ``pip install -e "git+https://github.com/ppwwyyxx/cocoapi#egg=pycocotools&subdirectory=PythonAPI"``
+  `pip install -e "git+https://github.com/ppwwyyxx/cocoapi#egg=pycocotools&subdirectory=PythonAPI"`
 ## 如何标注点云？

--- a/docs/zh_cn/getting_started.md
+++ b/docs/zh_cn/getting_started.md
@@ -7,30 +7,31 @@
 - GCC 5+
 - [MMCV](https://mmcv.readthedocs.io/en/latest/#installation)
-|  MMDetection3D 版本 |   MMDetection 版本  |  MMSegmentation 版本 |     MMCV 版本       |
+| MMDetection3D 版本 |      MMDetection 版本      |    MMSegmentation 版本    |           MMCV 版本           |
-|:-------------------:|:-------------------:|:-------------------:|:-------------------:|
+| :--------------: | :----------------------: | :---------------------: | :-------------------------: |
-| master              | mmdet>=2.19.0, <=3.0.0| mmseg>=0.20.0, <=1.0.0 | mmcv-full>=1.4.8, <=1.7.0|
+|      master      | mmdet>=2.24.0, \<=3.0.0  | mmseg>=0.20.0, \<=1.0.0 | mmcv-full>=1.4.8, \<=1.6.0  |
-| v1.0.0rc2           | mmdet>=2.19.0, <=3.0.0| mmseg>=0.20.0, <=1.0.0 | mmcv-full>=1.4.8, <=1.7.0|
+|    v1.0.0rc3     | mmdet>=2.24.0, \<=3.0.0  | mmseg>=0.20.0, \<=1.0.0 | mmcv-full>=1.4.8, \<=1.6.0  |
-| v1.0.0rc1           | mmdet>=2.19.0, <=3.0.0| mmseg>=0.20.0, <=1.0.0 | mmcv-full>=1.4.8, <=1.5.0|
+|    v1.0.0rc2     | mmdet>=2.24.0, \<=3.0.0  | mmseg>=0.20.0, \<=1.0.0 | mmcv-full>=1.4.8, \<=1.6.0  |
-| v1.0.0rc0           | mmdet>=2.19.0, <=3.0.0| mmseg>=0.20.0, <=1.0.0 | mmcv-full>=1.3.17, <=1.5.0|
+|    v1.0.0rc1     | mmdet>=2.19.0, \<=3.0.0  | mmseg>=0.20.0, \<=1.0.0 | mmcv-full>=1.4.8, \<=1.5.0  |
-| 0.18.1              | mmdet>=2.19.0, <=3.0.0| mmseg>=0.20.0, <=1.0.0 | mmcv-full>=1.3.17, <=1.5.0|
+|    v1.0.0rc0     | mmdet>=2.19.0, \<=3.0.0  | mmseg>=0.20.0, \<=1.0.0 | mmcv-full>=1.3.17, \<=1.5.0 |
-| 0.18.0              | mmdet>=2.19.0, <=3.0.0| mmseg>=0.20.0, <=1.0.0 | mmcv-full>=1.3.17, <=1.5.0|
+|      0.18.1      | mmdet>=2.19.0, \<=3.0.0  | mmseg>=0.20.0, \<=1.0.0 | mmcv-full>=1.3.17, \<=1.5.0 |
-| 0.17.3              | mmdet>=2.14.0, <=3.0.0| mmseg>=0.14.1, <=1.0.0 | mmcv-full>=1.3.8, <=1.4.0|
+|      0.18.0      | mmdet>=2.19.0, \<=3.0.0  | mmseg>=0.20.0, \<=1.0.0 | mmcv-full>=1.3.17, \<=1.5.0 |
-| 0.17.2              | mmdet>=2.14.0, <=3.0.0| mmseg>=0.14.1, <=1.0.0 | mmcv-full>=1.3.8, <=1.4.0|
+|      0.17.3      | mmdet>=2.14.0, \<=3.0.0  | mmseg>=0.14.1, \<=1.0.0 | mmcv-full>=1.3.8, \<=1.4.0  |
-| 0.17.1              | mmdet>=2.14.0, <=3.0.0| mmseg>=0.14.1, <=1.0.0 | mmcv-full>=1.3.8, <=1.4.0|
+|      0.17.2      | mmdet>=2.14.0, \<=3.0.0  | mmseg>=0.14.1, \<=1.0.0 | mmcv-full>=1.3.8, \<=1.4.0  |
-| 0.17.0              | mmdet>=2.14.0, <=3.0.0| mmseg>=0.14.1, <=1.0.0 | mmcv-full>=1.3.8, <=1.4.0|
+|      0.17.1      | mmdet>=2.14.0, \<=3.0.0  | mmseg>=0.14.1, \<=1.0.0 | mmcv-full>=1.3.8, \<=1.4.0  |
-| 0.16.0              | mmdet>=2.14.0, <=3.0.0| mmseg>=0.14.1, <=1.0.0 | mmcv-full>=1.3.8, <=1.4.0|
+|      0.17.0      | mmdet>=2.14.0, \<=3.0.0  | mmseg>=0.14.1, \<=1.0.0 | mmcv-full>=1.3.8, \<=1.4.0  |
-| 0.15.0              | mmdet>=2.14.0, <=3.0.0| mmseg>=0.14.1, <=1.0.0 | mmcv-full>=1.3.8, <=1.4.0|
+|      0.16.0      | mmdet>=2.14.0, \<=3.0.0  | mmseg>=0.14.1, \<=1.0.0 | mmcv-full>=1.3.8, \<=1.4.0  |
-| 0.14.0              | mmdet>=2.10.0, <=2.11.0| mmseg==0.14.0 | mmcv-full>=1.3.1, <=1.4.0|
+|      0.15.0      | mmdet>=2.14.0, \<=3.0.0  | mmseg>=0.14.1, \<=1.0.0 | mmcv-full>=1.3.8, \<=1.4.0  |
-| 0.13.0              | mmdet>=2.10.0, <=2.11.0| Not required  | mmcv-full>=1.2.4, <=1.4.0|
+|      0.14.0      | mmdet>=2.10.0, \<=2.11.0 |      mmseg==0.14.0      | mmcv-full>=1.3.1, \<=1.4.0  |
-| 0.12.0              | mmdet>=2.5.0, <=2.11.0 | Not required  | mmcv-full>=1.2.4, <=1.4.0|
+|      0.13.0      | mmdet>=2.10.0, \<=2.11.0 |      Not required       | mmcv-full>=1.2.4, \<=1.4.0  |
-| 0.11.0              | mmdet>=2.5.0, <=2.11.0 | Not required  | mmcv-full>=1.2.4, <=1.3.0|
+|      0.12.0      | mmdet>=2.5.0, \<=2.11.0  |      Not required       | mmcv-full>=1.2.4, \<=1.4.0  |
-| 0.10.0              | mmdet>=2.5.0, <=2.11.0 | Not required  | mmcv-full>=1.2.4, <=1.3.0|
+|      0.11.0      | mmdet>=2.5.0, \<=2.11.0  |      Not required       | mmcv-full>=1.2.4, \<=1.3.0  |
-| 0.9.0               | mmdet>=2.5.0, <=2.11.0 | Not required  | mmcv-full>=1.2.4, <=1.3.0|
+|      0.10.0      | mmdet>=2.5.0, \<=2.11.0  |      Not required       | mmcv-full>=1.2.4, \<=1.3.0  |
-| 0.8.0               | mmdet>=2.5.0, <=2.11.0 | Not required  | mmcv-full>=1.1.5, <=1.3.0|
+|      0.9.0       | mmdet>=2.5.0, \<=2.11.0  |      Not required       | mmcv-full>=1.2.4, \<=1.3.0  |
-| 0.7.0               | mmdet>=2.5.0, <=2.11.0 | Not required  | mmcv-full>=1.1.5, <=1.3.0|
+|      0.8.0       | mmdet>=2.5.0, \<=2.11.0  |      Not required       | mmcv-full>=1.1.5, \<=1.3.0  |
-| 0.6.0               | mmdet>=2.4.0, <=2.11.0 | Not required  | mmcv-full>=1.1.3, <=1.2.0|
+|      0.7.0       | mmdet>=2.5.0, \<=2.11.0  |      Not required       | mmcv-full>=1.1.5, \<=1.3.0  |
-| 0.5.0               | 2.3.0                  | Not required  | mmcv-full==1.0.5|
+|      0.6.0       | mmdet>=2.4.0, \<=2.11.0  |      Not required       | mmcv-full>=1.1.3, \<=1.2.0  |
+|      0.5.0       |          2.3.0           |      Not required       |      mmcv-full==1.0.5       |
 # 安装
@@ -91,6 +92,7 @@ conda install pytorch=1.3.1 cudatoolkit=9.2 torchvision=0.4.2 -c pytorch
 ```shell
 pip install mmcv-full -f https://download.openmmlab.com/mmcv/dist/{cu_version}/{torch_version}/index.html
 ```
 需要把命令行中的 `{cu_version}` 和 `{torch_version}` 替换成对应的版本。例如：在 CUDA 11 和 PyTorch 1.7.0 的环境下，可以使用下面命令安装最新版本的 MMCV：
 ```shell
@@ -140,6 +142,7 @@ pip install -v -e .  # or "python setup.py develop"
 ```shell
 pip install mmsegmentation
 ```
 同时，如果你想修改这部分的代码，也可以通过以下命令从源码编译 MMSegmentation：
 ```shell
@@ -156,8 +159,6 @@ git clone https://github.com/open-mmlab/mmdetection3d.git
 cd mmdetection3d
 ```
 **g. 安装依赖包和 MMDetection3D.**
 ```shell
@@ -168,19 +169,19 @@ pip install -v -e .  # or "python setup.py develop"
 1. Git 的 commit id 在步骤 d 将会被写入到版本号当中，例 0.6.0+2e7045c 。版本号将保存在训练的模型里。推荐在每一次执行步骤 d 时，从 github 上获取最新的更新。如果基于 C++/CUDA 的代码被修改了，请执行以下步骤；
-    > 重要: 如果你重装了不同版本的 CUDA 或者 PyTorch 的 mmdet，请务必移除 `./build` 文件。
+   > 重要: 如果你重装了不同版本的 CUDA 或者 PyTorch 的 mmdet，请务必移除 `./build` 文件。
-    ```shell
+   ```shell
-    pip uninstall mmdet3d
+   pip uninstall mmdet3d
-    rm -rf ./build
+   rm -rf ./build
-    find . -name "*.so" | xargs rm
+   find . -name "*.so" | xargs rm
-    ```
+   ```
 2. 按照上述说明，MMDetection3D 安装在 `dev` 模式下，因此在本地对代码做的任何修改都会生效，无需重新安装；
 3. 如果希望使用 `opencv-python-headless` 而不是 `opencv-python`， 可以在安装 MMCV 之前安装；
-4.  一些安装依赖是可以选择的。例如只需要安装最低运行要求的版本，则可以使用 `pip install -v -e .` 命令。如果希望使用可选择的像 `albumentations` 和 `imagecorruptions` 这种依赖项，可以使用 `pip install -r requirements/optional.txt ` 进行手动安装，或者在使用 `pip` 时指定所需的附加功能（例如 `pip install -v -e .[optional]`），支持附加功能的有效键值包括  `all`、`tests`、`build` 以及 `optional` 。
+4. 一些安装依赖是可以选择的。例如只需要安装最低运行要求的版本，则可以使用 `pip install -v -e .` 命令。如果希望使用可选择的像 `albumentations` 和 `imagecorruptions` 这种依赖项，可以使用 `pip install -r requirements/optional.txt ` 进行手动安装，或者在使用 `pip` 时指定所需的附加功能（例如 `pip install -v -e .[optional]`），支持附加功能的有效键值包括  `all`、`tests`、`build` 以及 `optional` 。
 5. 我们的代码目前不能在只有 CPU 的环境（CUDA 不可用）下编译运行。
@@ -253,7 +254,7 @@ python demo/pcd_demo.py demo/data/kitti/kitti_000008.bin configs/second/hv_secon
 如果你想输入一个 `ply` 格式的文件，你可以使用如下函数将它转换为 `bin` 的文件格式。然后就可以使用转化成 `bin` 格式的文件去运行样例程序。
-请注意在使用此脚本前，你需要先安装 `pandas` 和 `plyfile`。 这个函数也可使用在数据预处理当中，为了能够直接训练 ```ply data```。
+请注意在使用此脚本前，你需要先安装 `pandas` 和 `plyfile`。 这个函数也可使用在数据预处理当中，为了能够直接训练 `ply data`。
 ```python
 import numpy as np

--- a/docs/zh_cn/model_zoo.md
+++ b/docs/zh_cn/model_zoo.md
@@ -100,6 +100,10 @@
 请参考 [MonoFlex](https://github.com/open-mmlab/mmdetection3d/tree/v1.0.0.dev0/configs/monoflex) 获取更多细节，我们在 KITTI 数据集上给出了相应的结果.
+### SA-SSD
+请参考 [SA-SSD](https://github.com/open-mmlab/mmdetection3d/blob/master/configs/sassd) 获取更多的细节，我们在 KITTI 数据集上给出了相应的基准结果。
 ### Mixed Precision (FP16) Training
 细节请参考 [Mixed Precision (FP16) Training 在 PointPillars 训练的样例](https://github.com/open-mmlab/mmdetection3d/tree/v1.0.0.dev0/configs/pointpillars/hv_pointpillars_fpn_sbn-all_fp16_2x8_2x_nus-3d.py).
--- a/docs/zh_cn/supported_tasks/vision_det3d.md
+++ b/docs/zh_cn/supported_tasks/vision_det3d.md
-# 基于视觉的3D检测
+# 基于视觉的 3D 检测
+基于视觉的 3D 检测是指基于纯视觉输入的 3D 检测方法，例如基于单目、双目和多视图图像的 3D 检测。目前，我们只支持单目和多视图的 3D 检测方法。其他方法也应该与我们的框架兼容，并在将来得到支持。
+它期望给定的模型以任意数量的图像作为输入，并为每一个感兴趣的目标预测 3D 框及类别标签。以 nuScenes 数据集 FCOS3D 为例，我们将展示如何准备数据，在标准的 3D 检测基准上训练并测试模型，以及可视化并验证结果。
+## 数据准备
+首先，我们需要下载原始数据并按照[数据准备文档](https://mmdetection3d.readthedocs.io/zh_CN/latest/data_preparation.html)中提供的标准方式重新组织数据。
+由于不同数据集的原始数据有不同的组织方式，我们通常需要用 pkl 或 json 文件收集有用的数据信息。因此，在准备好所有的原始数据之后，我们需要运行 `create_data.py` 中提供的脚本来为不同的数据集生成数据信息。例如，对于 nuScenes，我们需要运行如下命令：
+```
+python tools/create_data.py nuscenes --root-path ./data/nuscenes --out-dir ./data/nuscenes --extra-tag nuscenes
+```
+随后，相关的目录结构将如下所示：
+```
+mmdetection3d
+├── mmdet3d
+├── tools
+├── configs
+├── data
+│   ├── nuscenes
+│   │   ├── maps
+│   │   ├── samples
+│   │   ├── sweeps
+│   │   ├── v1.0-test
+|   |   ├── v1.0-trainval
+│   │   ├── nuscenes_database
+│   │   ├── nuscenes_infos_train.pkl
+│   │   ├── nuscenes_infos_trainval.pkl
+│   │   ├── nuscenes_infos_val.pkl
+│   │   ├── nuscenes_infos_test.pkl
+│   │   ├── nuscenes_dbinfos_train.pkl
+│   │   ├── nuscenes_infos_train_mono3d.coco.json
+│   │   ├── nuscenes_infos_trainval_mono3d.coco.json
+│   │   ├── nuscenes_infos_val_mono3d.coco.json
+│   │   ├── nuscenes_infos_test_mono3d.coco.json
+```
+注意，此处的 pkl 文件主要用于使用 LiDAR 数据的方法，json 文件用于 2D 检测/纯视觉的 3D 检测。在 v0.13.0 支持单目 3D 检测之前，json 文件只包含 2D 检测的信息，因此如果你需要最新的信息，请切换到 v0.13.0 之后的分支。
+## 训练
+接着，我们将使用提供的配置文件训练 FCOS3D。基本的脚本与其他模型一样。当你使用不同的 GPU 设置进行训练时，你基本上可以按照这个[教程](https://mmdetection3d.readthedocs.io/zh_CN/latest/1_exist_data_model.html#inference-with-existing-models)的示例。假设我们在一台具有 8 块 GPU 的机器上使用分布式训练：
+```
+./tools/dist_train.sh configs/fcos3d/fcos3d_r101_caffe_fpn_gn-head_dcn_2x8_1x_nus-mono3d.py 8
+```
+注意，配置文件名中的 `2x8` 是指训练时用了 8 块 GPU，每块 GPU 上有 2 个数据样本。如果你的自定义设置不同于此，那么有时候你需要相应的调整学习率。基本规则可以参考[此处](https://arxiv.org/abs/1706.02677)。
+我们也可以通过运行以下命令微调 FCOS3D，从而达到更好的性能：
+```
+./tools/dist_train.sh fcos3d_r101_caffe_fpn_gn-head_dcn_2x8_1x_nus-mono3d_finetune.py 8
+```
+通过先前的脚本训练好一个基准模型后，请记得相应的修改[此处](https://github.com/open-mmlab/mmdetection3d/blob/master/configs/fcos3d/fcos3d_r101_caffe_fpn_gn-head_dcn_2x8_1x_nus-mono3d_finetune.py#L8)的路径。
+## 定量评估
+在训练期间，模型权重文件将会根据配置文件中的 `evaluation = dict(interval=xxx)` 设置被周期性地评估。
+我们支持不同数据集的官方评估方案。由于输出格式与基于其他模态的 3D 检测相同，因此评估方法也是一样的。
+对于 nuScenes，将使用基于距离的平均精度（mAP）以及 nuScenes 检测分数（NDS）分别对 10 个类别进行评估。评估结果将会被打印到终端中，如下所示：
+```
+mAP: 0.3197
+mATE: 0.7595
+mASE: 0.2700
+mAOE: 0.4918
+mAVE: 1.3307
+mAAE: 0.1724
+NDS: 0.3905
+Eval time: 170.8s
+Per-class results:
+Object Class    AP      ATE     ASE     AOE     AVE     AAE
+car     0.503   0.577   0.152   0.111   2.096   0.136
+truck   0.223   0.857   0.224   0.220   1.389   0.179
+bus     0.294   0.855   0.204   0.190   2.689   0.283
+trailer 0.081   1.094   0.243   0.553   0.742   0.167
+construction_vehicle    0.058   1.017   0.450   1.019   0.137   0.341
+pedestrian      0.392   0.687   0.284   0.694   0.876   0.158
+motorcycle      0.317   0.737   0.265   0.580   2.033   0.104
+bicycle 0.308   0.704   0.299   0.892   0.683   0.010
+traffic_cone    0.555   0.486   0.309   nan     nan     nan
+barrier 0.466   0.581   0.269   0.169   nan     nan
+```
+此外，在训练完成后你也可以评估特定的模型权重文件。你可以简单地执行以下脚本：
+```
+./tools/dist_test.sh configs/fcos3d/fcos3d_r101_caffe_fpn_gn-head_dcn_2x8_1x_nus-mono3d.py \
+    work_dirs/fcos3d/latest.pth --eval mAP
+```
+## 测试与提交
+如果你只想在在线基准上进行推理或测试模型性能，你需要将之前评估脚本中的 `--eval mAP` 替换成 `--format-only`，并在需要的情况下指定 `jsonfile_prefix`，例如，添加选项 `--eval-options jsonfile_prefix=work_dirs/fcos3d/test_submission`。请确保配置文件中的[测试信息](https://github.com/open-mmlab/mmdetection3d/blob/master/configs/_base_/datasets/nus-mono3d.py#L93)由验证集相应地改为测试集。
+在生成结果后，你可以压缩文件夹并上传至 nuScenes 3D 检测挑战的 evalAI 评估服务器上。
+## 定性评估
+MMDetection3D 还提供了通用的可视化工具，以便于我们可以对训练好的模型预测的检测结果有一个直观的感受。你也可以在评估阶段通过设置 `--eval-options 'show=True' 'out_dir=${SHOW_DIR}'` 来在线可视化检测结果，或者使用 `tools/misc/visualize_results.py` 来离线地进行可视化。
+此外，我们还提供了脚本 `tools/misc/browse_dataset.py` 用于可视化数据集而不做推理。更多的细节请参考[可视化文档](https://mmdetection3d.readthedocs.io/zh_CN/latest/useful_tools.html#visualization)。
+注意，目前我们仅支持纯视觉方法在图像上的可视化。将来我们将集成在前景图以及鸟瞰图（BEV）中的可视化。
--- a/docs/zh_cn/tutorials/backends_support.md
+++ b/docs/zh_cn/tutorials/backends_support.md
 # 教程 7: 后端支持
 我们支持不同的文件客户端后端：磁盘、Ceph 和 LMDB 等。下面是修改配置使之从 Ceph 加载和保存数据的示例。
 ## 从 Ceph 读取数据和标注文件
@@ -93,9 +94,8 @@ data = dict(
    test=dict(pipeline=test_pipeline, classes=class_names, file_client_args=file_client_args))
 ```
 ## 从 Ceph 读取预训练模型
 ```python
 model = dict(
    pts_backbone=dict(
@@ -108,6 +108,7 @@ model = dict(
 ```
 ## 从 Ceph 读取模型权重文件
 ```python
 # replace the path with your checkpoint path on Ceph
 load_from = 's3://openmmlab/checkpoints/mmdetection3d/v0.1.0_models/pointpillars/hv_pointpillars_secfpn_6x8_160e_kitti-3d-car/hv_pointpillars_secfpn_6x8_160e_kitti-3d-car_20200620_230614-77663cd6.pth.pth'
@@ -131,6 +132,7 @@ evaluation = dict(interval=1, save_best='bbox', out_dir='s3://openmmlab/mmdetect
 ```
 ## 训练日志保存至 Ceph
 训练后的训练日志会备份到指定的 Ceph 路径。
 ```python
@@ -140,6 +142,7 @@ log_config = dict(
        dict(type='TextLoggerHook', out_dir='s3://openmmlab/mmdetection3d'),
    ])
 ```
 您还可以通过设置 `keep_local = False` 备份到指定的 Ceph 路径后删除本地训练日志。
 ```python

--- a/docs/zh_cn/tutorials/config.md
+++ b/docs/zh_cn/tutorials/config.md
@@ -34,15 +34,15 @@
 - `{backbone}`： 主干网络种类例如 `regnet-400mf`、`regnet-1.6gf` 等。
 - `{neck}`：模型颈部的种类包括 `fpn`、`secfpn` 等。
 - `[norm_setting]`：如无特殊声明，默认使用 `bn` (Batch Normalization)，其他类型可以有 `gn` (Group Normalization)、`sbn` (Synchronized Batch Normalization) 等。
-    `gn-head`/`gn-neck` 表示 GN 仅应用于网络的头部或颈部，而 `gn-all` 表示 GN 用于整个模型，例如主干网络、颈部和头部。
+  `gn-head`/`gn-neck` 表示 GN 仅应用于网络的头部或颈部，而 `gn-all` 表示 GN 用于整个模型，例如主干网络、颈部和头部。
 - `[misc]`：模型中各式各样的设置/插件，例如 `strong-aug` 意味着在训练过程中使用更强的数据增广策略。
 - `[batch_per_gpu x gpu]`：每个 GPU 的样本数和 GPU 数量，默认使用 `4x8`。
 - `{schedule}`：训练方案，选项是 `1x`、`2x`、`20e` 等。
-    `1x` 和 `2x` 分别代表训练 12 和 24 轮。
+  `1x` 和 `2x` 分别代表训练 12 和 24 轮。
-    `20e` 在级联模型中使用，表示训练 20 轮。
+  `20e` 在级联模型中使用，表示训练 20 轮。
-    对于 `1x`/`2x`，初始学习率在第 8/16 和第 11/22 轮衰减 10 倍；对于 `20e`，初始学习率在第 16 和第 19 轮衰减 10 倍。
+  对于 `1x`/`2x`，初始学习率在第 8/16 和第 11/22 轮衰减 10 倍；对于 `20e`，初始学习率在第 16 和第 19 轮衰减 10 倍。
 - `{dataset}`：数据集，例如 `nus-3d`、`kitti-3d`、`lyft-3d`、`scannet-3d`、`sunrgbd-3d` 等。
-    当某一数据集存在多种设定时，我们也标记下所使用的类别数量，例如 `kitti-3d-3class` 和 `kitti-3d-car` 分别意味着在 KITTI 的所有三类上和单独车这一类上进行训练。
+  当某一数据集存在多种设定时，我们也标记下所使用的类别数量，例如 `kitti-3d-3class` 和 `kitti-3d-car` 分别意味着在 KITTI 的所有三类上和单独车这一类上进行训练。
 ## 弃用的 train_cfg/test_cfg

--- a/docs/zh_cn/tutorials/coord_sys_tutorial.md
+++ b/docs/zh_cn/tutorials/coord_sys_tutorial.md
@@ -7,43 +7,43 @@ MMDetection3D 使用 3 种不同的坐标系。3D 目标检测领域中不同坐
 尽管数据集和采集设备多种多样，但是通过总结 3D 目标检测的工作线，我们可以将坐标系大致分为三类：
 - 相机坐标系 -- 大多数相机的坐标系，在该坐标系中 y 轴正方向指向地面，x 轴正方向指向右侧，z 轴正方向指向前方。
-    ```
+  ```
-                上  z 前
+              上  z 前
-                |    ^
+              |    ^
-                |   /
+              |   /
-                |  /
+              |  /
-                | /
+              | /
-                |/
+              |/
-    左   ------ 0 ------> x 右
+  左   ------ 0 ------> x 右
-                |
+              |
-                |
+              |
-                |
+              |
-                |
+              |
-                v
+              v
-              y 下
+            y 下
-    ```
+  ```
 - 激光雷达坐标系 -- 众多激光雷达的坐标系，在该坐标系中 z 轴负方向指向地面，x 轴正方向指向前方，y 轴正方向指向左侧。
-    ```
+  ```
-                  z 上   x 前
+                z 上   x 前
-                   ^    ^
+                 ^    ^
-                   |   /
+                 |   /
-                   |  /
+                 |  /
-                   | /
+                 | /
-                   |/
+                 |/
-    y 左   <------ 0 ------ 右
+  y 左   <------ 0 ------ 右
-    ```
+  ```
 - 深度坐标系 -- VoteNet、H3DNet 等模型使用的坐标系，在该坐标系中 z 轴负方向指向地面，x 轴正方向指向右侧，y 轴正方向指向前方。
-    ```
+  ```
-               z 上   y 前
+             z 上   y 前
-                ^    ^
+              ^    ^
-                |   /
+              |   /
-                |  /
+              |  /
-                | /
+              | /
-                |/
+              |/
-    左   ------ 0 ------> x 右
+  左   ------ 0 ------> x 右
-    ```
+  ```
-该教程中的坐标系定义实际上**不仅仅是定义三个轴**。对于形如 ``$$`(x, y, z, dx, dy, dz, r)`$$`` 的框来说，我们的坐标系也定义了如何解释框的尺寸 ``$$`(dx, dy, dz)`$$`` 和转向角 (yaw) 角度 ``$$`r`$$``。
+该教程中的坐标系定义实际上**不仅仅是定义三个轴**。对于形如 `` $$`(x, y, z, dx, dy, dz, r)`$$ `` 的框来说，我们的坐标系也定义了如何解释框的尺寸 `` $$`(dx, dy, dz)`$$ `` 和转向角 (yaw) 角度 `` $$`r`$$ ``。
 三个坐标系的图示如下：
@@ -55,13 +55,13 @@ MMDetection3D 使用 3 种不同的坐标系。3D 目标检测领域中不同坐
 ## 转向角 (yaw) 的定义
-请参考[维基百科](https://en.wikipedia.org/wiki/Euler_angles#Tait%E2%80%93Bryan_angles)了解转向角的标准定义。在目标检测中，我们选择一个轴作为重力轴，并在垂直于重力轴的平面 ``$$`\Pi`$$`` 上选取一个参考方向，那么参考方向的转向角为 0，在 ``$$`\Pi`$$`` 上的其他方向有非零的转向角，其角度取决于其与参考方向的角度。
+请参考[维基百科](https://en.wikipedia.org/wiki/Euler_angles#Tait%E2%80%93Bryan_angles)了解转向角的标准定义。在目标检测中，我们选择一个轴作为重力轴，并在垂直于重力轴的平面 `` $$`\Pi`$$ `` 上选取一个参考方向，那么参考方向的转向角为 0，在 `` $$`\Pi`$$ `` 上的其他方向有非零的转向角，其角度取决于其与参考方向的角度。
 目前，对于所有支持的数据集，标注不包括俯仰角 (pitch) 和滚动角 (roll)，这意味着我们在预测框和计算框之间的重叠时只需考虑转向角 (yaw)。
 在 MMDetection3D 中，所有坐标系都是右手坐标系，这意味着如果从重力轴的负方向（轴的正方向指向人眼）看，转向角 (yaw) 沿着逆时针方向增加。
-下图显示，在右手坐标系中，如果我们设定 x 轴正方向为参考方向，那么 y 轴正方向的转向角 (yaw) 为 ``$$`\frac{\pi}{2}`$$``。
+下图显示，在右手坐标系中，如果我们设定 x 轴正方向为参考方向，那么 y 轴正方向的转向角 (yaw) 为 `` $$`\frac{\pi}{2}`$$ ``。
 ```
                     z 上  y 前 (yaw=0.5*pi)
@@ -92,9 +92,9 @@ __|____|____|____|______\ x 右
 ## 框尺寸的定义
-框尺寸的定义与转向角 (yaw) 的定义是分不开的。在上一节中，我们提到如果一个框的转向角 (yaw) 为 0，它的方向就被定义为与 x 轴平行。那么自然地，一个框对应于 x 轴的尺寸应该是 ``$$`dx`$$``。但是，这在某些数据集中并非总是如此（我们稍后会解决这个问题）。
+框尺寸的定义与转向角 (yaw) 的定义是分不开的。在上一节中，我们提到如果一个框的转向角 (yaw) 为 0，它的方向就被定义为与 x 轴平行。那么自然地，一个框对应于 x 轴的尺寸应该是 `` $$`dx`$$ ``。但是，这在某些数据集中并非总是如此（我们稍后会解决这个问题）。
-下图展示了 x 轴和 ``$$`dx`$$``，y 轴和 ``$$`dy`$$`` 对应的含义。
+下图展示了 x 轴和 `` $$`dx`$$ ``，y 轴和 `` $$`dy`$$ `` 对应的含义。
 ```
 y 前
@@ -111,7 +111,7 @@ __|____|____|____|______\ x 右
  |         dy
 ```
-注意框的方向总是和 ``$$`dx`$$`` 边平行。
+注意框的方向总是和 `` $$`dx`$$ `` 边平行。
 ```
 y 前
@@ -138,12 +138,12 @@ KITTI 数据集的原始标注是在相机坐标系下的，详见 [get_label_an
 ![](https://raw.githubusercontent.com/traveller59/second.pytorch/master/images/kittibox.png)
-对于每个框来说，尺寸为 ``$$`(w, l, h)`$$``，转向角 (yaw) 的参考方向为 y 轴正方向。更多细节请参考[代码库](https://github.com/traveller59/second.pytorch#concepts)。
+对于每个框来说，尺寸为 `` $$`(w, l, h)`$$ ``，转向角 (yaw) 的参考方向为 y 轴正方向。更多细节请参考[代码库](https://github.com/traveller59/second.pytorch#concepts)。
 我们的激光雷达坐标系有两处改变：
 - 转向角 (yaw) 被定义为右手而非左手，从而保持一致性；
- 框的尺寸为 ``$$`(l, w, h)`$$`` 而非 ``$$`(w, l, h)`$$``，由于在 KITTI 数据集中 ``$$`w`$$`` 对应 ``$$`dy`$$``，``$$`l`$$`` 对应 ``$$`dx`$$``。
+- 框的尺寸为 `` $$`(l, w, h)`$$ `` 而非 `` $$`(w, l, h)`$$ ``，由于在 KITTI 数据集中 `` $$`w`$$ `` 对应 `` $$`dy`$$ ``，`` $$`l`$$ `` 对应 `` $$`dx`$$ ``。
 ### Waymo
@@ -151,7 +151,7 @@ KITTI 数据集的原始标注是在相机坐标系下的，详见 [get_label_an
 ### NuScenes
-NuScenes 提供了一个评估工具包，其中每个框都被包装成一个 `Box` 实例。`Box` 的坐标系不同于我们的激光雷达坐标系，在 `Box` 坐标系中，前两个表示框尺寸的元素分别对应 ``$$`(dy, dx)`$$`` 或者 ``$$`(w, l)`$$``，和我们的表示方法相反。更多细节请参考 NuScenes [教程](https://github.com/open-mmlab/mmdetection3d/blob/master/docs/zh_cn/datasets/nuscenes_det.md#notes)。
+NuScenes 提供了一个评估工具包，其中每个框都被包装成一个 `Box` 实例。`Box` 的坐标系不同于我们的激光雷达坐标系，在 `Box` 坐标系中，前两个表示框尺寸的元素分别对应 `` $$`(dy, dx)`$$ `` 或者 `` $$`(w, l)`$$ ``，和我们的表示方法相反。更多细节请参考 NuScenes [教程](https://github.com/open-mmlab/mmdetection3d/blob/master/docs/zh_cn/datasets/nuscenes_det.md#notes)。
 读者可以参考 [NuScenes 开发工具](https://github.com/nutonomy/nuscenes-devkit/tree/master/python-sdk/nuscenes/eval/detection)，了解 [NuScenes 框](https://github.com/nutonomy/nuscenes-devkit/blob/2c6a752319f23910d5f55cc995abc547a9e54142/python-sdk/nuscenes/utils/data_classes.py#L457) 的定义和 [NuScenes 评估](https://github.com/nutonomy/nuscenes-devkit/blob/master/python-sdk/nuscenes/eval/detection/evaluate.py)的过程。
@@ -183,25 +183,25 @@ SUN RGB-D 的原始数据不是点云而是 RGB-D 图像。我们通过反投影
 首先，对于点和框的中心点，坐标转换前后满足下列关系：
- ``$$`x_{LiDAR}=z_{camera}`$$``
+- `` $$`x_{LiDAR}=z_{camera}`$$ ``
- ``$$`y_{LiDAR}=-x_{camera}`$$``
+- `` $$`y_{LiDAR}=-x_{camera}`$$ ``
- ``$$`z_{LiDAR}=-y_{camera}`$$``
+- `` $$`z_{LiDAR}=-y_{camera}`$$ ``
 然后，框的尺寸转换前后满足下列关系：
- ``$$`dx_{LiDAR}=dx_{camera}`$$``
+- `` $$`dx_{LiDAR}=dx_{camera}`$$ ``
- ``$$`dy_{LiDAR}=dz_{camera}`$$``
+- `` $$`dy_{LiDAR}=dz_{camera}`$$ ``
- ``$$`dz_{LiDAR}=dy_{camera}`$$``
+- `` $$`dz_{LiDAR}=dy_{camera}`$$ ``
 最后，转向角 (yaw) 也应该被转换：
- ``$$`r_{LiDAR}=-\frac{\pi}{2}-r_{camera}`$$``
+- `` $$`r_{LiDAR}=-\frac{\pi}{2}-r_{camera}`$$ ``
 详见[此处](https://github.com/open-mmlab/mmdetection3d/blob/master/mmdet3d/core/bbox/structures/box_3d_mode.py)代码了解更多细节。
 ### 鸟瞰图
-如果 3D 框是 ``$$`(x, y, z, dx, dy, dz, r)`$$``，相机坐标系下框的鸟瞰图是 ``$$`(x, z, dx, dz, -r)`$$``。转向角 (yaw) 符号取反是因为相机坐标系重力轴的正方向指向地面。
+如果 3D 框是 `` $$`(x, y, z, dx, dy, dz, r)`$$ ``，相机坐标系下框的鸟瞰图是 `` $$`(x, z, dx, dz, -r)`$$ ``。转向角 (yaw) 符号取反是因为相机坐标系重力轴的正方向指向地面。
 详见[此处](https://github.com/open-mmlab/mmdetection3d/blob/master/mmdet3d/core/bbox/structures/cam_box3d.py)代码了解更多细节。
@@ -223,18 +223,18 @@ SUN RGB-D 的原始数据不是点云而是 RGB-D 图像。我们通过反投影
 否。例如在 KITTI 中，从相机坐标系转换为激光雷达坐标系时，我们需要一个校准矩阵。
-#### Q3: 框中转向角 (yaw) ``$$`2\pi`$$`` 的相位差如何影响评估？
+#### Q3: 框中转向角 (yaw) `` $$`2\pi`$$ `` 的相位差如何影响评估？
-对于交并比 (IoU) 计算，转向角 (yaw) 有 ``$$`2\pi`$$`` 的相位差的两个框是相同的，所以不会影响评估。
+对于交并比 (IoU) 计算，转向角 (yaw) 有 `` $$`2\pi`$$ `` 的相位差的两个框是相同的，所以不会影响评估。
-对于角度预测评估，例如 NuScenes 中的 NDS 指标和 KITTI 中的 AOS 指标，会先对预测框的角度进行标准化，因此 ``$$`2\pi`$$`` 的相位差不会改变结果。
+对于角度预测评估，例如 NuScenes 中的 NDS 指标和 KITTI 中的 AOS 指标，会先对预测框的角度进行标准化，因此 `` $$`2\pi`$$ `` 的相位差不会改变结果。
-#### Q4: 框中转向角 (yaw) ``$$`\pi`$$`` 的相位差如何影响评估？
+#### Q4: 框中转向角 (yaw) `` $$`\pi`$$ `` 的相位差如何影响评估？
-对于交并比 (IoU) 计算，转向角 (yaw) 有 ``$$`\pi`$$`` 的相位差的两个框是相同的，所以不会影响评估。
+对于交并比 (IoU) 计算，转向角 (yaw) 有 `` $$`\pi`$$ `` 的相位差的两个框是相同的，所以不会影响评估。
 然而，对于角度预测评估，这会导致完全相反的方向。
-考虑一辆汽车，转向角 (yaw) 是汽车前部方向与 x 轴正方向之间的夹角。如果我们将该角度增加 ``$$`\pi`$$``，车前部将变成车后部。
+考虑一辆汽车，转向角 (yaw) 是汽车前部方向与 x 轴正方向之间的夹角。如果我们将该角度增加 `` $$`\pi`$$ ``，车前部将变成车后部。
-对于某些类别，例如障碍物，前后没有区别，因此 ``$$`\pi`$$`` 的相位差不会对角度预测分数产生影响。
+对于某些类别，例如障碍物，前后没有区别，因此 `` $$`\pi`$$ `` 的相位差不会对角度预测分数产生影响。
--- a/docs/zh_cn/tutorials/customize_dataset.md
+++ b/docs/zh_cn/tutorials/customize_dataset.md
@@ -215,62 +215,62 @@ dataset_A_train = dict(
 1. 如果待拼接的数据集的类别相同，标注文件的不同，此时可通过下面的方式来实现数据集的拼接：
-    ```python
+   ```python
-    dataset_A_train = dict(
+   dataset_A_train = dict(
-        type='Dataset_A',
+       type='Dataset_A',
-        ann_file = ['anno_file_1', 'anno_file_2'],
+       ann_file = ['anno_file_1', 'anno_file_2'],
-        pipeline=train_pipeline
+       pipeline=train_pipeline
-    )
+   )
-    ```
+   ```
-    如果拼接数据集用于测试或者评估，那么这种拼接方式能够对每个数据集进行分开地测试或者评估，若希望对拼接数据集进行整体的测试或者评估，此时需要设置 `separate_eval=False`，如下所示：
+   如果拼接数据集用于测试或者评估，那么这种拼接方式能够对每个数据集进行分开地测试或者评估，若希望对拼接数据集进行整体的测试或者评估，此时需要设置 `separate_eval=False`，如下所示：
-    ```python
+   ```python
-    dataset_A_train = dict(
+   dataset_A_train = dict(
-        type='Dataset_A',
+       type='Dataset_A',
-        ann_file = ['anno_file_1', 'anno_file_2'],
+       ann_file = ['anno_file_1', 'anno_file_2'],
-        separate_eval=False,
+       separate_eval=False,
-        pipeline=train_pipeline
+       pipeline=train_pipeline
-    )
+   )
-    ```
+   ```
 2. 如果待拼接的数据集完全不相同，此时可通过拼接不同数据集的配置的方式实现数据集的拼接，如下所示：
-    ```python
+   ```python
-    dataset_A_train = dict()
+   dataset_A_train = dict()
-    dataset_B_train = dict()
+   dataset_B_train = dict()
-    data = dict(
+   data = dict(
-        imgs_per_gpu=2,
+       imgs_per_gpu=2,
-        workers_per_gpu=2,
+       workers_per_gpu=2,
-        train = [
+       train = [
-            dataset_A_train,
+           dataset_A_train,
-            dataset_B_train
+           dataset_B_train
-        ],
+       ],
-        val = dataset_A_val,
+       val = dataset_A_val,
-        test = dataset_A_test
+       test = dataset_A_test
-        )
+       )
-    ```
+   ```
-    如果拼接数据集用于测试或者评估，那么这种拼接方式能够对每个数据集进行分开地测试或者评估。
+   如果拼接数据集用于测试或者评估，那么这种拼接方式能够对每个数据集进行分开地测试或者评估。
 3. 可以通过显示地定义 `ConcatDataset` 来实现数据集的拼接，如下所示：
-    ```python
+   ```python
-    dataset_A_val = dict()
+   dataset_A_val = dict()
-    dataset_B_val = dict()
+   dataset_B_val = dict()
-    data = dict(
+   data = dict(
-        imgs_per_gpu=2,
+       imgs_per_gpu=2,
-        workers_per_gpu=2,
+       workers_per_gpu=2,
-        train=dataset_A_train,
+       train=dataset_A_train,
-        val=dict(
+       val=dict(
-            type='ConcatDataset',
+           type='ConcatDataset',
-            datasets=[dataset_A_val, dataset_B_val],
+           datasets=[dataset_A_val, dataset_B_val],
-            separate_eval=False))
+           separate_eval=False))
-    ```
+   ```
-    其中，`separate_eval=False` 表示将所有的数据集作为一个整体进行评估。
+   其中，`separate_eval=False` 表示将所有的数据集作为一个整体进行评估。
 **注意:**

--- a/docs/zh_cn/tutorials/customize_runtime.md
+++ b/docs/zh_cn/tutorials/customize_runtime.md
@@ -40,7 +40,7 @@ class MyOptimizer(Optimizer):
 - 新建 `mmdet3d/core/optimizer/__init__.py` 文件用于引入。
-    新定义的模块应该在 `mmdet3d/core/optimizer/__init__.py` 中被引入，使得注册器可以找到新模块并注册之：
+  新定义的模块应该在 `mmdet3d/core/optimizer/__init__.py` 中被引入，使得注册器可以找到新模块并注册之：
 ```python
 from .my_optimizer import MyOptimizer
@@ -114,35 +114,35 @@ class MyOptimizerConstructor(object):
 - __使用梯度裁剪 (gradient clip) 来稳定训练过程__：
-    一些模型依赖梯度裁剪技术来裁剪训练中的梯度，以稳定训练过程。举例如下：
+  一些模型依赖梯度裁剪技术来裁剪训练中的梯度，以稳定训练过程。举例如下：
-    ```python
+  ```python
-    optimizer_config = dict(
+  optimizer_config = dict(
-        _delete_=True, grad_clip=dict(max_norm=35, norm_type=2))
+      _delete_=True, grad_clip=dict(max_norm=35, norm_type=2))
-    ```
+  ```
-    如果您的配置继承了一个已经设置了 `optimizer_config` 的基础配置，那么您可能需要 `_delete_=True` 字段来覆盖基础配置中无用的设置。详见配置文件的[说明文档](https://mmdetection.readthedocs.io/zh_CN/latest/tutorials/config.html)。
+  如果您的配置继承了一个已经设置了 `optimizer_config` 的基础配置，那么您可能需要 `_delete_=True` 字段来覆盖基础配置中无用的设置。详见配置文件的[说明文档](https://mmdetection.readthedocs.io/zh_CN/latest/tutorials/config.html)。
 - __使用动量规划器 (momentum scheduler) 来加速模型收敛__：
-    我们支持用动量规划器来根据学习率更改模型的动量，这样可以使模型更快地收敛。
+  我们支持用动量规划器来根据学习率更改模型的动量，这样可以使模型更快地收敛。
-    动量规划器通常和学习率规划器一起使用，比如说，如下配置文件在 3D 检测中被用于加速模型收敛。
+  动量规划器通常和学习率规划器一起使用，比如说，如下配置文件在 3D 检测中被用于加速模型收敛。
-    更多细节详见 [CyclicLrUpdater](https://github.com/open-mmlab/mmcv/blob/v1.3.7/mmcv/runner/hooks/lr_updater.py#L358) 和 [CyclicMomentumUpdater](https://github.com/open-mmlab/mmcv/blob/v1.3.7/mmcv/runner/hooks/momentum_updater.py#L225) 的实现。
+  更多细节详见 [CyclicLrUpdater](https://github.com/open-mmlab/mmcv/blob/v1.3.7/mmcv/runner/hooks/lr_updater.py#L358) 和 [CyclicMomentumUpdater](https://github.com/open-mmlab/mmcv/blob/v1.3.7/mmcv/runner/hooks/momentum_updater.py#L225) 的实现。
-    ```python
+  ```python
-    lr_config = dict(
+  lr_config = dict(
-        policy='cyclic',
+      policy='cyclic',
-        target_ratio=(10, 1e-4),
+      target_ratio=(10, 1e-4),
-        cyclic_times=1,
+      cyclic_times=1,
-        step_ratio_up=0.4,
+      step_ratio_up=0.4,
-    )
+  )
-    momentum_config = dict(
+  momentum_config = dict(
-        policy='cyclic',
+      policy='cyclic',
-        target_ratio=(0.85 / 0.95, 1),
+      target_ratio=(0.85 / 0.95, 1),
-        cyclic_times=1,
+      cyclic_times=1,
-        step_ratio_up=0.4,
+      step_ratio_up=0.4,
-    )
+  )
-    ```
+  ```
 ## 自定义训练规程
@@ -151,20 +151,20 @@ class MyOptimizerConstructor(object):
 - 多项式衰减规程:
-    ```python
+  ```python
-    lr_config = dict(policy='poly', power=0.9, min_lr=1e-4, by_epoch=False)
+  lr_config = dict(policy='poly', power=0.9, min_lr=1e-4, by_epoch=False)
-    ```
+  ```
 - 余弦退火规程:
-    ```python
+  ```python
-    lr_config = dict(
+  lr_config = dict(
-        policy='CosineAnnealing',
+      policy='CosineAnnealing',
-        warmup='linear',
+      warmup='linear',
-        warmup_iters=1000,
+      warmup_iters=1000,
-        warmup_ratio=1.0 / 10,
+      warmup_ratio=1.0 / 10,
-        min_lr_ratio=1e-5)
+      min_lr_ratio=1e-5)
-    ```
+  ```
 ## 自定义工作流
@@ -238,7 +238,7 @@ class MyHook(Hook):
 - 更改 `mmdet3d/core/utils/__init__.py` 来引入之：
-    新定义的模块应在 `mmdet3d/core/utils/__init__.py` 中引入，以使得注册器可以找到新模块并注册之：
+  新定义的模块应在 `mmdet3d/core/utils/__init__.py` 中引入，以使得注册器可以找到新模块并注册之：
 ```python
 from .my_hook import MyHook

--- a/docs/zh_cn/tutorials/data_pipeline.md
+++ b/docs/zh_cn/tutorials/data_pipeline.md
@@ -78,100 +78,113 @@ test_pipeline = [
 ### 数据加载
 `LoadPointsFromFile`
 - 添加：points
 `LoadPointsFromMultiSweeps`
 - 更新：points
 `LoadAnnotations3D`
 - 添加：gt_bboxes_3d, gt_labels_3d, gt_bboxes, gt_labels, pts_instance_mask, pts_semantic_mask, bbox3d_fields, pts_mask_fields, pts_seg_fields
 ### 预处理
 `GlobalRotScaleTrans`
 - 添加：pcd_trans, pcd_rotation, pcd_scale_factor
- 更新：points, *bbox3d_fields
+- 更新：points, \*bbox3d_fields
 `RandomFlip3D`
 - 添加：flip, pcd_horizontal_flip, pcd_vertical_flip
- 更新：points, *bbox3d_fields
+- 更新：points, \*bbox3d_fields
 `PointsRangeFilter`
 - 更新：points
 `ObjectRangeFilter`
 - 更新：gt_bboxes_3d, gt_labels_3d
 `ObjectNameFilter`
 - 更新：gt_bboxes_3d, gt_labels_3d
 `PointShuffle`
 - 更新：points
 `PointsRangeFilter`
 - 更新：points
 ### 格式化
 `DefaultFormatBundle3D`
 - 更新：points, gt_bboxes_3d, gt_labels_3d, gt_bboxes, gt_labels
 `Collect3D`
 - 添加：img_meta （由 `meta_keys` 指定的键值构成的 img_meta）
 - 移除：所有除 `keys` 指定的键值以外的其他键值
 ### 测试时的数据增强
 `MultiScaleFlipAug`
 - 更新: scale, pcd_scale_factor, flip, flip_direction, pcd_horizontal_flip, pcd_vertical_flip （与这些指定的参数对应的增强后的数据列表）
 ## 扩展并使用自定义数据集预处理方法
 1. 在任意文件中写入新的数据集预处理方法，如 `my_pipeline.py`，该预处理方法的输入和输出均为字典
-    ```python
+   ```python
-    from mmdet.datasets import PIPELINES
+   from mmdet.datasets import PIPELINES
-    @PIPELINES.register_module()
+   @PIPELINES.register_module()
-    class MyTransform:
+   class MyTransform:
-        def __call__(self, results):
+       def __call__(self, results):
-            results['dummy'] = True
+           results['dummy'] = True
-            return results
+           return results
-    ```
+   ```
 2. 导入新的预处理方法类
-    ```python
+   ```python
-    from .my_pipeline import MyTransform
+   from .my_pipeline import MyTransform
-    ```
+   ```
 3. 在配置文件中使用该数据集预处理方法
-    ```python
+   ```python
-    train_pipeline = [
+   train_pipeline = [
-        dict(
+       dict(
-            type='LoadPointsFromFile',
+           type='LoadPointsFromFile',
-            load_dim=5,
+           load_dim=5,
-            use_dim=5,
+           use_dim=5,
-            file_client_args=file_client_args),
+           file_client_args=file_client_args),
-        dict(
+       dict(
-            type='LoadPointsFromMultiSweeps',
+           type='LoadPointsFromMultiSweeps',
-            sweeps_num=10,
+           sweeps_num=10,
-            file_client_args=file_client_args),
+           file_client_args=file_client_args),
-        dict(type='LoadAnnotations3D', with_bbox_3d=True, with_label_3d=True),
+       dict(type='LoadAnnotations3D', with_bbox_3d=True, with_label_3d=True),
-        dict(
+       dict(
-            type='GlobalRotScaleTrans',
+           type='GlobalRotScaleTrans',
-            rot_range=[-0.3925, 0.3925],
+           rot_range=[-0.3925, 0.3925],
-            scale_ratio_range=[0.95, 1.05],
+           scale_ratio_range=[0.95, 1.05],
-            translation_std=[0, 0, 0]),
+           translation_std=[0, 0, 0]),
-        dict(type='RandomFlip3D', flip_ratio_bev_horizontal=0.5),
+       dict(type='RandomFlip3D', flip_ratio_bev_horizontal=0.5),
-        dict(type='PointsRangeFilter', point_cloud_range=point_cloud_range),
+       dict(type='PointsRangeFilter', point_cloud_range=point_cloud_range),
-        dict(type='ObjectRangeFilter', point_cloud_range=point_cloud_range),
+       dict(type='ObjectRangeFilter', point_cloud_range=point_cloud_range),
-        dict(type='ObjectNameFilter', classes=class_names),
+       dict(type='ObjectNameFilter', classes=class_names),
-        dict(type='MyTransform'),
+       dict(type='MyTransform'),
-        dict(type='PointShuffle'),
+       dict(type='PointShuffle'),
-        dict(type='DefaultFormatBundle3D', class_names=class_names),
+       dict(type='DefaultFormatBundle3D', class_names=class_names),
-        dict(type='Collect3D', keys=['points', 'gt_bboxes_3d', 'gt_labels_3d'])
+       dict(type='Collect3D', keys=['points', 'gt_bboxes_3d', 'gt_labels_3d'])
-    ]
+   ]
-    ```
+   ```
--- a/docs/zh_cn/tutorials/model_deployment.md
+++ b/docs/zh_cn/tutorials/model_deployment.md
@@ -37,17 +37,17 @@ python ./tools/deploy.py \
 ### 参数描述
-* `deploy_cfg` : MMDeploy 代码库中用于部署的配置文件路径。
+- `deploy_cfg` : MMDeploy 代码库中用于部署的配置文件路径。
-* `model_cfg` : OpenMMLab 系列代码库中使用的模型配置文件路径。
+- `model_cfg` : OpenMMLab 系列代码库中使用的模型配置文件路径。
-* `checkpoint` : OpenMMLab 系列代码库的模型文件路径。
+- `checkpoint` : OpenMMLab 系列代码库的模型文件路径。
-* `img` : 用于模型转换时使用的点云文件或图像文件路径。
+- `img` : 用于模型转换时使用的点云文件或图像文件路径。
-* `--test-img` : 用于测试模型的图像文件路径。如果没有指定，将设置成 `None`。
+- `--test-img` : 用于测试模型的图像文件路径。如果没有指定，将设置成 `None`。
-* `--work-dir` : 工作目录，用来保存日志和模型文件。
+- `--work-dir` : 工作目录，用来保存日志和模型文件。
-* `--calib-dataset-cfg` : 此参数只在 int8 模式下生效，用于校准数据集配置文件。如果没有指定，将被设置成 `None`，并使用模型配置文件中的 'val' 数据集进行校准。
+- `--calib-dataset-cfg` : 此参数只在 int8 模式下生效，用于校准数据集配置文件。如果没有指定，将被设置成 `None`，并使用模型配置文件中的 'val' 数据集进行校准。
-* `--device` : 用于模型转换的设备。如果没有指定，将被设置成 cpu。
+- `--device` : 用于模型转换的设备。如果没有指定，将被设置成 cpu。
-* `--log-level` : 设置日记的等级，选项包括 `'CRITICAL'，'FATAL'，'ERROR'，'WARN'，'WARNING'，'INFO'，'DEBUG'，'NOTSET'`。如果没有指定，将被设置成 INFO。
+- `--log-level` : 设置日记的等级，选项包括 `'CRITICAL'，'FATAL'，'ERROR'，'WARN'，'WARNING'，'INFO'，'DEBUG'，'NOTSET'`。如果没有指定，将被设置成 INFO。
-* `--show` : 是否显示检测的结果。
+- `--show` : 是否显示检测的结果。
-* `--dump-info` : 是否输出 SDK 信息。
+- `--dump-info` : 是否输出 SDK 信息。
 ### 示例
@@ -110,12 +110,12 @@ python tools/test.py \
 ## 支持模型列表
-| Model                | TorchScript | OnnxRuntime | TensorRT | NCNN  | PPLNN | OpenVINO | Model config                                                                           |
+| Model                | TorchScript | OnnxRuntime | TensorRT | NCNN | PPLNN | OpenVINO | Model config                                                                           |
-| -------------------- | :---------: | :---------: | :------: | :---: | :---: | :------: | -------------------------------------------------------------------------------------- |
+| -------------------- | :---------: | :---------: | :------: | :--: | :---: | :------: | -------------------------------------------------------------------------------------- |
-| PointPillars         |      ?      |      Y      |    Y     |   N   |   N   |    Y     | [config](https://github.com/open-mmlab/mmdetection3d/blob/master/configs/pointpillars) |
+| PointPillars         |      ?      |      Y      |    Y     |  N   |   N   |    Y     | [config](https://github.com/open-mmlab/mmdetection3d/blob/master/configs/pointpillars) |
-| CenterPoint (pillar) |      ?      |      Y      |    Y     |   N   |   N   |    Y     | [config](https://github.com/open-mmlab/mmdetection3d/blob/master/configs/centerpoint)  |
+| CenterPoint (pillar) |      ?      |      Y      |    Y     |  N   |   N   |    Y     | [config](https://github.com/open-mmlab/mmdetection3d/blob/master/configs/centerpoint)  |
 ## 注意
-* MMDeploy 的版本需要 >= 0.4.0。
+- MMDeploy 的版本需要 >= 0.4.0。
-* 目前 CenterPoint 仅支持了 pillar 版本的。
+- 目前 CenterPoint 仅支持了 pillar 版本的。
--- a/docs/zh_cn/useful_tools.md
+++ b/docs/zh_cn/useful_tools.md
@@ -14,26 +14,26 @@ python tools/analysis_tools/analyze_logs.py plot_curve [--keys ${KEYS}] [--title
 示例：
-   绘制出某次运行的分类 loss。
+- 绘制出某次运行的分类 loss。
-    ```shell
+  ```shell
-    python tools/analysis_tools/analyze_logs.py plot_curve log.json --keys loss_cls --legend loss_cls
+  python tools/analysis_tools/analyze_logs.py plot_curve log.json --keys loss_cls --legend loss_cls
-    ```
+  ```
-   绘制出某次运行的分类和回归 loss，并且保存图片为 pdf 格式。
+- 绘制出某次运行的分类和回归 loss，并且保存图片为 pdf 格式。
-    ```shell
+  ```shell
-    python tools/analysis_tools/analyze_logs.py plot_curve log.json --keys loss_cls loss_bbox --out losses.pdf
+  python tools/analysis_tools/analyze_logs.py plot_curve log.json --keys loss_cls loss_bbox --out losses.pdf
-    ```
+  ```
-   在同一张图片中比较两次运行的 bbox mAP。
+- 在同一张图片中比较两次运行的 bbox mAP。
-    ```shell
+  ```shell
-    # 根据 Car_3D_moderate_strict 在 KITTI 上评估 PartA2 和 second。
+  # 根据 Car_3D_moderate_strict 在 KITTI 上评估 PartA2 和 second。
-    python tools/analysis_tools/analyze_logs.py plot_curve tools/logs/PartA2.log.json tools/logs/second.log.json --keys KITTI/Car_3D_moderate_strict --legend PartA2 second --mode eval --interval 1
+  python tools/analysis_tools/analyze_logs.py plot_curve tools/logs/PartA2.log.json tools/logs/second.log.json --keys KITTI/Car_3D_moderate_strict --legend PartA2 second --mode eval --interval 1
-    # 根据 Car_3D_moderate_strict 在 KITTI 上分别对车和 3 类评估 PointPillars。
+  # 根据 Car_3D_moderate_strict 在 KITTI 上分别对车和 3 类评估 PointPillars。
-    python tools/analysis_tools/analyze_logs.py plot_curve tools/logs/pp-3class.log.json tools/logs/pp.log.json --keys KITTI/Car_3D_moderate_strict --legend pp-3class pp --mode eval --interval 2
+  python tools/analysis_tools/analyze_logs.py plot_curve tools/logs/pp-3class.log.json tools/logs/pp.log.json --keys KITTI/Car_3D_moderate_strict --legend pp-3class pp --mode eval --interval 2
-    ```
+  ```
 您也能计算平均训练速度。
@@ -51,7 +51,7 @@ time std over epochs is 0.0028
 average iter time: 1.1959 s/iter
 ```
-&emsp;
+&#8195;
 # 可视化
@@ -80,7 +80,6 @@ python tools/test.py ${CONFIG_FILE} ${CKPT_PATH} --eval 'mAP' --eval-options 'sh
 python tools/misc/visualize_results.py ${CONFIG_FILE} --result ${RESULTS_PATH} --show-dir ${SHOW_DIR}
 ```
 ![](../../resources/open3d_visual.*)
 或者您可以使用 3D 可视化软件，例如 [MeshLab](http://www.meshlab.net/) 来打开这些在 `${SHOW_DIR}` 目录下的文件，从而查看 3D 检测输出。具体来说，打开 `***_points.obj` 查看输入点云，打开 `***_pred.obj` 查看预测的 3D 边界框。这允许推理和结果生成在远程服务器中完成，用户可以使用 GUI 在他们的主机上打开它们。
@@ -127,7 +126,7 @@ python tools/misc/browse_dataset.py configs/_base_/datasets/nus-mono3d.py --task
 ![](../../resources/browse_dataset_mono.png)
-&emsp;
+&#8195;
 # 模型部署
@@ -185,7 +184,7 @@ python tools/deployment/test_torchserver.py ${IMAGE_FILE} ${CONFIG_FILE} ${CHECK
 python tools/deployment/test_torchserver.py demo/data/kitti/kitti_000008.bin configs/second/hv_second_secfpn_6x8_80e_kitti-3d-car.py checkpoints/hv_second_secfpn_6x8_80e_kitti-3d-car_20200620_230238-393f000c.pth second
 ```
-&emsp;
+&#8195;
 # 模型复杂度
@@ -211,7 +210,7 @@ Params: 953.83 k
 2. 一些运算操作不计入计算量 (FLOPs)，比如说像GN和定制的运算操作，详细细节请参考 [`mmcv.cnn.get_model_complexity_info()`](https://github.com/open-mmlab/mmcv/blob/master/mmcv/cnn/utils/flops_counter.py)。
 3. 我们现在仅仅支持单模态输入（点云或者图片）的单阶段模型的计算量 (FLOPs) 计算，我们将会在未来支持两阶段和多模态模型的计算。
-&emsp;
+&#8195;
 # 模型转换
@@ -253,7 +252,7 @@ python tools/model_converters/publish_model.py work_dirs/faster_rcnn/latest.pth
 最终的输出文件名将会是 `faster_rcnn_r50_fpn_1x_20190801-{hash id}.pth`。
-&emsp;
+&#8195;
 # 数据集转换
@@ -266,15 +265,15 @@ python -u tools/data_converter/nuimage_converter.py --data-root ${DATA_ROOT} --v
                                                    --out-dir ${OUT_DIR} --nproc ${NUM_WORKERS} --extra-tag ${TAG}
 ```
-   `--data-root`: 数据集的根目录，默认为 `./data/nuimages`。
+- `--data-root`: 数据集的根目录，默认为 `./data/nuimages`。
-   `--version`: 数据集的版本，默认为 `v1.0-mini`。要获取完整数据集，请使用 `--version v1.0-train v1.0-val v1.0-mini`。
+- `--version`: 数据集的版本，默认为 `v1.0-mini`。要获取完整数据集，请使用 `--version v1.0-train v1.0-val v1.0-mini`。
-   `--out-dir`: 注释和语义掩码的输出目录，默认为 `./data/nuimages/annotations/`。
+- `--out-dir`: 注释和语义掩码的输出目录，默认为 `./data/nuimages/annotations/`。
-   `--nproc`: 数据准备的进程数，默认为 `4`。由于图片是并行处理的，更大的进程数目能够减少准备时间。
+- `--nproc`: 数据准备的进程数，默认为 `4`。由于图片是并行处理的，更大的进程数目能够减少准备时间。
-   `--extra-tag`: 注释的额外标签，默认为 `nuimages`。这可用于将不同时间处理的不同注释分开以供研究。
+- `--extra-tag`: 注释的额外标签，默认为 `nuimages`。这可用于将不同时间处理的不同注释分开以供研究。
 更多的数据准备细节参考 [doc](https://mmdetection3d.readthedocs.io/zh_CN/latest/data_preparation.html)，nuImages 数据集的细节参考 [README](https://github.com/open-mmlab/mmdetection3d/blob/master/configs/nuimages/README.md/)。
-&emsp;
+&#8195;
 # 其他内容

--- a/mmdet3d/__init__.py
+++ b/mmdet3d/__init__.py
@@ -28,7 +28,7 @@ assert (mmcv_version >= digit_version(mmcv_minimum_version)
    f'MMCV=={mmcv.__version__} is used but incompatible. ' \
    f'Please install mmcv>={mmcv_minimum_version}, <={mmcv_maximum_version}.'
-mmdet_minimum_version = '2.19.0'
+mmdet_minimum_version = '2.24.0'
 mmdet_maximum_version = '3.0.0'
 mmdet_version = digit_version(mmdet.__version__)
 assert (mmdet_version >= digit_version(mmdet_minimum_version)

--- a/mmdet3d/core/post_processing/box3d_nms.py
+++ b/mmdet3d/core/post_processing/box3d_nms.py
@@ -4,8 +4,6 @@ import numpy as np
 import torch
 from mmcv.ops import nms, nms_rotated
-from ..bbox import xywhr2xyxyr
 def box3d_multiclass_nms(mlvl_bboxes,
                         mlvl_bboxes_for_nms,
@@ -254,6 +252,8 @@ def nms_bev(boxes, scores, thresh, pre_max_size=None, post_max_size=None):
    if pre_max_size is not None:
        order = order[:pre_max_size]
    boxes = boxes[order].contiguous()
+    scores = scores[order]
    # xyxyr -> back to xywhr
    # note: better skip this step before nms_bev call in the future
    boxes = torch.stack(
@@ -262,6 +262,7 @@ def nms_bev(boxes, scores, thresh, pre_max_size=None, post_max_size=None):
        dim=-1)
    keep = nms_rotated(boxes, scores, thresh)[1]
+    keep = order[keep]
    if post_max_size is not None:
        keep = keep[:post_max_size]
    return keep
@@ -284,4 +285,4 @@ def nms_normal_bev(boxes, scores, thresh):
        torch.Tensor: Remaining indices with scores in descending order.
    """
    assert boxes.shape[1] == 5, 'Input boxes shape should be [N, 5]'
-    return nms(xywhr2xyxyr(boxes)[:, :-1], scores, thresh)[1]
+    return nms(boxes[:, :-1], scores, thresh)[1]
--- a/mmdet3d/datasets/builder.py
+++ b/mmdet3d/datasets/builder.py
@@ -3,6 +3,7 @@ import platform
 from mmcv.utils import Registry, build_from_cfg
+from mmdet.datasets import DATASETS as MMDET_DATASETS
 from mmdet.datasets.builder import _concat_dataset
 if platform.system() != 'Windows':
@@ -39,7 +40,8 @@ def build_dataset(cfg, default_args=None):
        dataset = CBGSDataset(build_dataset(cfg['dataset'], default_args))
    elif isinstance(cfg.get('ann_file'), (list, tuple)):
        dataset = _concat_dataset(cfg, default_args)
-    else:
+    elif cfg['type'] in DATASETS._module_dict.keys():
        dataset = build_from_cfg(cfg, DATASETS, default_args)
+    else:
+        dataset = build_from_cfg(cfg, MMDET_DATASETS, default_args)
    return dataset
--- a/mmdet3d/datasets/custom_3d.py
+++ b/mmdet3d/datasets/custom_3d.py
@@ -182,7 +182,9 @@ class Custom3DDataset(Dataset):
            origin=(0.5, 0.5, 0.5)).convert_to(self.box_mode_3d)
        anns_results = dict(
-            gt_bboxes_3d=gt_bboxes_3d, gt_labels_3d=gt_labels_3d)
+            gt_bboxes_3d=gt_bboxes_3d,
+            gt_labels_3d=gt_labels_3d,
+            gt_names=gt_names_3d)
        return anns_results
    def pre_pipeline(self, results):

--- a/mmdet3d/datasets/custom_3d_seg.py
+++ b/mmdet3d/datasets/custom_3d_seg.py
@@ -276,7 +276,8 @@ class Custom3DSegDataset(Dataset):
        if scene_idxs is None:
            scene_idxs = np.arange(len(self.data_infos))
        if isinstance(scene_idxs, str):
-            scene_idxs = np.load(scene_idxs)
+            with self.file_client.get_local_path(scene_idxs) as local_path:
+                scene_idxs = np.load(local_path)
        else:
            scene_idxs = np.array(scene_idxs)

--- a/mmdet3d/datasets/pipelines/compose.py
+++ b/mmdet3d/datasets/pipelines/compose.py
@@ -24,7 +24,8 @@ class Compose:
        self.transforms = []
        for transform in transforms:
            if isinstance(transform, dict):
-                if transform['type'] in PIPELINES._module_dict.keys():
+                _, key = PIPELINES.split_scope_key(transform['type'])
+                if key in PIPELINES._module_dict.keys():
                    transform = build_from_cfg(transform, PIPELINES)
                else:
                    transform = build_from_cfg(transform, MMDET_PIPELINES)

--- a/mmdet3d/datasets/s3dis_dataset.py
+++ b/mmdet3d/datasets/s3dis_dataset.py
@@ -381,7 +381,8 @@ class S3DISSegDataset(_S3DISSegDataset):
                modality=modality,
                test_mode=test_mode,
                ignore_index=ignore_index,
-                scene_idxs=scene_idxs[i]) for i in range(len(ann_files))
+                scene_idxs=scene_idxs[i],
+                **kwargs) for i in range(len(ann_files))
        ]
        # data_infos and scene_idxs need to be concat

--- a/mmdet3d/models/builder.py
+++ b/mmdet3d/models/builder.py
@@ -46,7 +46,7 @@ def build_neck(cfg):
 def build_roi_extractor(cfg):
    """Build RoI feature extractor."""
-    if cfg['type'] in NECKS._module_dict.keys():
+    if cfg['type'] in ROI_EXTRACTORS._module_dict.keys():
        return ROI_EXTRACTORS.build(cfg)
    else:
        return MMDET_ROI_EXTRACTORS.build(cfg)