fix dtype

abc991da · Kexin Yu · f54cc1c9 · abc991da · abc991da
Commit abc991da authored May 21, 2020 by Kexin Yu
Show whitespace changes
Inline Side-by-side

Showing with 4 additions and 3 deletions

csrc/multi_tensor_lamb.cu csrc/multi_tensor_lamb.cu +2 -2

csrc/multi_tensor_lamb_stage_1.cu csrc/multi_tensor_lamb_stage_1.cu +2 -1

No files found.
--- a/csrc/multi_tensor_lamb.cu
+++ b/csrc/multi_tensor_lamb.cu
@@ -52,7 +52,7 @@ struct LAMBStage1Functor
    const float epsilon,
    adamMode_t mode,
    const float decay,
-    at::Tensor global_grad_norm,
+    const float global_grad_norm,
    const float max_global_grad_norm)
  {
    // I'd like this kernel to propagate infs/nans.
@@ -387,7 +387,7 @@ void multi_tensor_lamb_cuda(
        epsilon,
        (adamMode_t) mode,
        weight_decay,
-        global_grad_norm,
+        global_grad_norm.data(),
        max_grad_norm); )
  // Compute update norms

--- a/csrc/multi_tensor_lamb_stage_1.cu
+++ b/csrc/multi_tensor_lamb_stage_1.cu
@@ -123,7 +123,8 @@ void multi_tensor_lamb_stage1_cuda(
 {
  using namespace at;
-  float clipped_global_grad_norm = global_grad_norm > max_global_grad_norm ? global_grad_norm / max_global_grad_norm : 1.0f;
+  auto g_grad_norm = global_grad_norm.data();
+  float clipped_global_grad_norm = g_grad_norm > max_global_grad_norm ? g_grad_norm / max_global_grad_norm : 1.0f;
  float next_step = float(step+1);
  float beta1_correction = 1.0f - std::pow(beta1, next_step);
  float beta2_correction = 1.0f - std::pow(beta2, next_step);