Fix copies between DETR and DETA (#29037)

8a0ed0a9 · amyeroberts · GitHub · 5b6fa230 · 8a0ed0a9
Unverified Commit 8a0ed0a9 authored Feb 15, 2024 by amyeroberts Committed by GitHub Feb 15, 2024
Show whitespace changes
Inline Side-by-side

Showing with 2 additions and 1 deletion

src/transformers/models/deta/modeling_deta.py src/transformers/models/deta/modeling_deta.py +2 -1

No files found.
--- a/src/transformers/models/deta/modeling_deta.py
+++ b/src/transformers/models/deta/modeling_deta.py
@@ -627,7 +627,8 @@ class DetaMultiscaleDeformableAttention(nn.Module):
    def _reset_parameters(self):
        nn.init.constant_(self.sampling_offsets.weight.data, 0.0)
-        thetas = torch.arange(self.n_heads, dtype=torch.int64).float() * (2.0 * math.pi / self.n_heads)
+        default_dtype = torch.get_default_dtype()
+        thetas = torch.arange(self.n_heads, dtype=torch.int64).to(default_dtype) * (2.0 * math.pi / self.n_heads)
        grid_init = torch.stack([thetas.cos(), thetas.sin()], -1)
        grid_init = (
            (grid_init / grid_init.abs().max(-1, keepdim=True)[0])