[Fix] Fix init weights of MultiScaleDeformableAttention (#2158)

* fix tensors on different device * fix lint * Update mmcv/ops/multi_scale_deform_attn.py Co-authored-by: Zaida Zhou <58739961+zhouzaida@users.noreply.github.com> Co-authored-by: Zaida Zhou <58739961+zhouzaida@users.noreply.github.com>

[Fix] Fix init weights of MultiScaleDeformableAttention (#2158)
* fix tensors on different device * fix lint * Update mmcv/ops/multi_scale_deform_attn.py Co-authored-by: Zaida Zhou <58739961+zhouzaida@users.noreply.github.com> Co-authored-by: Zaida Zhou <58739961+zhouzaida@users.noreply.github.com>
47a61c3b · Cedric Luo · GitHub · fb795962 · 47a61c3b
Unverified Commit 47a61c3b authored Aug 01, 2022 by Cedric Luo Committed by GitHub Aug 01, 2022
Hide whitespace changes
Inline Side-by-side

Showing with 3 additions and 2 deletions

mmcv/ops/multi_scale_deform_attn.py mmcv/ops/multi_scale_deform_attn.py +3 -2

No files found.
--- a/mmcv/ops/multi_scale_deform_attn.py
+++ b/mmcv/ops/multi_scale_deform_attn.py
@@ -235,9 +235,10 @@ class MultiScaleDeformableAttention(BaseModule):
    def init_weights(self) -> None:
        """Default initialization for Parameters of Module."""
        constant_init(self.sampling_offsets, 0.)
+        device = next(self.parameters()).device
        thetas = torch.arange(
-            self.num_heads,
+            self.num_heads, dtype=torch.float32,
-            dtype=torch.float32) * (2.0 * math.pi / self.num_heads)
+            device=device) * (2.0 * math.pi / self.num_heads)
        grid_init = torch.stack([thetas.cos(), thetas.sin()], -1)
        grid_init = (grid_init /
                     grid_init.abs().max(-1, keepdim=True)[0]).view(