Update FlaxLMSDiscreteScheduler (#1474)

- Add the missing `scale_model_input` method to `FlaxLMSDiscreteScheduler` - Use `jnp.append` for appending to `state.derivatives` - Use `jnp.delete` to pop from `state.derivatives`

Update FlaxLMSDiscreteScheduler (#1474)
- Add the missing `scale_model_input` method to `FlaxLMSDiscreteScheduler` - Use `jnp.append` for appending to `state.derivatives` - Use `jnp.delete` to pop from `state.derivatives`
155d272c · bachr · GitHub · 2b30b109 · 155d272c
Unverified Commit 155d272c authored Dec 02, 2022 by bachr Committed by GitHub Dec 02, 2022
Hide whitespace changes
Inline Side-by-side

Showing with 24 additions and 2 deletions

src/diffusers/schedulers/scheduling_lms_discrete_flax.py src/diffusers/schedulers/scheduling_lms_discrete_flax.py +24 -2

No files found.
--- a/src/diffusers/schedulers/scheduling_lms_discrete_flax.py
+++ b/src/diffusers/schedulers/scheduling_lms_discrete_flax.py
@@ -102,6 +102,28 @@ class FlaxLMSDiscreteScheduler(FlaxSchedulerMixin, ConfigMixin):
            sigmas=((1 - self.alphas_cumprod) / self.alphas_cumprod) ** 0.5,
        )

+    def scale_model_input(
+        self, state: LMSDiscreteSchedulerState, sample: jnp.ndarray, timestep: int
+    ) -> jnp.ndarray:
+        """
+        Scales the denoising model input by `(sigma**2 + 1) ** 0.5` to match the K-LMS algorithm.
+
+        Args:
+            state (`LMSDiscreteSchedulerState`):
+                the `FlaxLMSDiscreteScheduler` state data class instance.
+            sample (`jnp.ndarray`):
+                current instance of sample being created by diffusion process.
+            timestep (`int`):
+                current discrete timestep in the diffusion chain.
+
+        Returns:
+            `jnp.ndarray`: scaled input sample
+        """
+        step_index, = jnp.where(scheduler_state.timesteps == timestep, size=1)
+        sigma = scheduler_state.sigmas[step_index]
+        sample = sample / ((sigma**2 + 1) ** 0.5)
+        return sample
+
    def get_lms_coefficient(self, state, order, t, current_order):
        """
        Compute a linear multistep coefficient.
@@ -186,9 +208,9 @@ class FlaxLMSDiscreteScheduler(FlaxSchedulerMixin, ConfigMixin):

        # 2. Convert to an ODE derivative
        derivative = (sample - pred_original_sample) / sigma
-        state = state.replace(derivatives=state.derivatives.append(derivative))
+        state = state.replace(derivatives=jnp.append(state.derivatives, derivative))
        if len(state.derivatives) > order:
-            state = state.replace(derivatives=state.derivatives.pop(0))
+            state = state.replace(derivatives=jnp.delete(state.derivatives, 0))

        # 3. Compute linear multistep coefficients
        order = min(timestep + 1, order)