follow advice of Tim to fix update of momentum vs parameters in blockwise 8 bit

9b656f46 · Phil Wang · 369a51c4 · 9b656f46
Commit 9b656f46 authored Mar 22, 2023 by Phil Wang
Hide whitespace changes
Inline Side-by-side

Showing with 2 additions and 1 deletion

csrc/kernels.cu csrc/kernels.cu +2 -1

No files found.
--- a/csrc/kernels.cu
+++ b/csrc/kernels.cu
@@ -1708,6 +1708,7 @@ kOptimizerStatic8bit1StateBlockwise(T* p, T* __restrict__ const g, unsigned char
 											s1_vals[j] = (s1_vals[j]*beta1) + g_val;
 										break;
 									case LION:
+                    g_vals[j] = lr*sgn(((float)s1_vals[j])*beta1 + ((1.0f-beta1)*((float)g_vals[j])));
 										s1_vals[j] = s1_vals[j]*beta2 + ((1.0f-beta2)*g_val);
 										break;
 									case RMSPROP:
@@ -1748,7 +1749,7 @@ kOptimizerStatic8bit1StateBlockwise(T* p, T* __restrict__ const g, unsigned char
 										p_vals[j] = ((float)p_vals[j]) - lr*(s1_vals[j]);
 										break;
 									case LION:
-										p_vals[j] = ((float)p_vals[j]) - lr*sgn(((float)s1_vals[j])*beta1 + ((1.0f-beta1)*((float)g_vals[j])));
+										p_vals[j] = ((float)p_vals[j]) - ((float)g_vals[j]);
 										break;
 									case RMSPROP:
 										g_val = g_vals[j];