add docs and TODO

1a74819d · wuyuefeng · 5db915b5 · 1a74819d · 1a74819d · 1a74819d
Commit 1a74819d authored Apr 30, 2020 by wuyuefeng
3 changed files
--- a/mmdet3d/models/middle_encoders/__init__.py
+++ b/mmdet3d/models/middle_encoders/__init__.py
 from .pillar_scatter import PointPillarsScatter
 from .sparse_encoder import SparseEncoder
-from .sparse_unetv2 import SparseUnetV2
+from .sparse_unet import SparseUnet
-__all__ = ['PointPillarsScatter', 'SparseEncoder', 'SparseUnetV2']
+__all__ = ['PointPillarsScatter', 'SparseEncoder', 'SparseUnet']
--- a/mmdet3d/models/middle_encoders/sparse_unetv2.py
+++ b/mmdet3d/models/middle_encoders/sparse_unetv2.py
@@ -8,15 +8,17 @@ from ..registry import MIDDLE_ENCODERS
 @MIDDLE_ENCODERS.register_module
-class SparseUnetV2(nn.Module):
+class SparseUnet(nn.Module):
    def __init__(self,
                 in_channels,
                 output_shape,
-                 pre_act,
+                 pre_act=False,
                 norm_cfg=dict(type='BN1d', eps=1e-3, momentum=0.01)):
        """SparseUnet for PartA^2
+        See https://arxiv.org/abs/1907.03670 for more detials.
        Args:
            in_channels (int): the number of input channels
            output_shape (list[int]): the shape of output tensor
@@ -32,6 +34,7 @@ class SparseUnetV2(nn.Module):
        # TODO: make the network could be modified
        if pre_act:
+            # TODO: use ConvModule to encapsulate
            self.conv_input = spconv.SparseSequential(
                spconv.SubMConv3d(
                    in_channels,
@@ -180,11 +183,8 @@ class SparseUnetV2(nn.Module):
        self.conv5 = spconv.SparseSequential(
            block(16, 16, 3, norm_cfg=norm_cfg, padding=1, indice_key='subm1'))
-        self.seg_cls_layer = nn.Linear(16, 1, bias=True)
-        self.seg_reg_layer = nn.Linear(16, 3, bias=True)
    def forward(self, voxel_features, coors, batch_size):
-        """Forward of SparseUnetV2
+        """Forward of SparseUnet
        Args:
            voxel_features (torch.float32): shape [N, C]
@@ -231,14 +231,7 @@ class SparseUnetV2(nn.Module):
        seg_features = x_up1.features
-        seg_cls_preds = self.seg_cls_layer(seg_features)  # (N, 1)
+        ret.update({'seg_features': seg_features})
-        seg_reg_preds = self.seg_reg_layer(seg_features)  # (N, 3)
-        ret.update({
-            'u_seg_preds': seg_cls_preds,
-            'u_reg_preds': seg_reg_preds,
-            'seg_features': seg_features
-        })
        return ret
@@ -307,6 +300,7 @@ class SparseUnetV2(nn.Module):
        Returns:
            spconv.SparseSequential: pre activate sparse convolution block.
        """
+        # TODO: use ConvModule to encapsulate
        assert conv_type in ['subm', 'spconv', 'inverseconv']
        norm_name, norm_layer = build_norm_layer(norm_cfg, in_channels)
@@ -374,6 +368,7 @@ class SparseUnetV2(nn.Module):
        Returns:
            spconv.SparseSequential: post activate sparse convolution block.
        """
+        # TODO: use ConvModule to encapsulate
        assert conv_type in ['subm', 'spconv', 'inverseconv']
        norm_name, norm_layer = build_norm_layer(norm_cfg, out_channels)

--- a/tests/test_sparse_unetv2.py
+++ b/tests/test_sparse_unetv2.py
 import torch
-def test_SparseUnetV2():
+def test_SparseUnet():
-    from mmdet3d.models.middle_encoders.sparse_unetv2 import SparseUnetV2
+    from mmdet3d.models.middle_encoders.sparse_unet import SparseUnet
-    self = SparseUnetV2(
+    self = SparseUnet(
        in_channels=4, output_shape=[41, 1600, 1408], pre_act=False)
    voxel_features = torch.tensor([[6.56126, 0.9648336, -1.7339306, 0.315],
                                   [6.8162713, -2.480431, -1.3616394, 0.36],
@@ -16,13 +16,9 @@ def test_SparseUnetV2():
        dtype=torch.int32)  # n, 4(batch, ind_x, ind_y, ind_z)
    unet_ret_dict = self.forward(voxel_features, coordinates, 2)
-    seg_cls_preds = unet_ret_dict['u_seg_preds']
-    seg_reg_preds = unet_ret_dict['u_reg_preds']
    seg_features = unet_ret_dict['seg_features']
    spatial_features = unet_ret_dict['spatial_features']
-    assert seg_cls_preds.shape == torch.Size([4, 1])
-    assert seg_reg_preds.shape == torch.Size([4, 3])
    assert seg_features.shape == torch.Size([4, 16])
    assert spatial_features.shape == torch.Size([2, 256, 200, 176])