fix parameter type

90729bc8 · Kexin Yu · 32d2c4e2 · 90729bc8
Commit 90729bc8 authored Mar 31, 2020 by Kexin Yu
Show whitespace changes
Inline Side-by-side

Showing with 2 additions and 2 deletions

apex/contrib/csrc/optimizers/fused_lamb_cuda_kernel.cu apex/contrib/csrc/optimizers/fused_lamb_cuda_kernel.cu +2 -2

No files found.
--- a/apex/contrib/csrc/optimizers/fused_lamb_cuda_kernel.cu
+++ b/apex/contrib/csrc/optimizers/fused_lamb_cuda_kernel.cu
@@ -41,7 +41,7 @@ struct LAMBStage1Functor
    const float epsilon,
    adamMode_t mode,
    const float decay,
-    float* global_grad_norm,
+    float global_grad_norm,
    float max_global_grad_norm)
  {
    // I'd like this kernel to propagate infs/nans.
@@ -52,7 +52,7 @@ struct LAMBStage1Functor
    int chunk_idx = tl.block_to_chunk[blockIdx.x];
    int n = tl.sizes[tensor_loc];

-    float clipped_global_grad_norm = (*global_grad_norm) > max_global_grad_norm ? (*global_grad_norm) / max_global_grad_norm : 1.0f;
+    float clipped_global_grad_norm = global_grad_norm > max_global_grad_norm ? global_grad_norm / max_global_grad_norm : 1.0f;

    T* g = (T*)tl.addresses[0][tensor_loc];
    g += chunk_idx*chunk_size;