[`Wan`] Fix VAE sampling mode in `WanVideoToVideoPipeline` (#11639)

* fix: vae sampling mode * fix a typo

[`Wan`] Fix VAE sampling mode in `WanVideoToVideoPipeline` (#11639)
* fix: vae sampling mode * fix a typo
e27142ac · Tolga Cangöz · GitHub · 8e88495d · e27142ac
Unverified Commit e27142ac authored Jun 11, 2025 by Tolga Cangöz Committed by GitHub Jun 11, 2025
Show whitespace changes
Inline Side-by-side

Showing with 2 additions and 7 deletions

src/diffusers/pipelines/wan/pipeline_wan_video2video.py src/diffusers/pipelines/wan/pipeline_wan_video2video.py +2 -7

No files found.
--- a/src/diffusers/pipelines/wan/pipeline_wan_video2video.py
+++ b/src/diffusers/pipelines/wan/pipeline_wan_video2video.py
@@ -419,12 +419,7 @@ class WanVideoToVideoPipeline(DiffusionPipeline, WanLoraLoaderMixin):
        )
        if latents is None:
-            if isinstance(generator, list):
+            init_latents = [retrieve_latents(self.vae.encode(vid.unsqueeze(0)), sample_mode="argmax") for vid in video]
-                init_latents = [
-                    retrieve_latents(self.vae.encode(video[i].unsqueeze(0)), generator[i]) for i in range(batch_size)
-                ]
-            else:
-                init_latents = [retrieve_latents(self.vae.encode(vid.unsqueeze(0)), generator) for vid in video]
            init_latents = torch.cat(init_latents, dim=0).to(dtype)
@@ -441,7 +436,7 @@ class WanVideoToVideoPipeline(DiffusionPipeline, WanLoraLoaderMixin):
            if hasattr(self.scheduler, "add_noise"):
                latents = self.scheduler.add_noise(init_latents, noise, timestep)
            else:
-                latents = self.scheduelr.scale_noise(init_latents, timestep, noise)
+                latents = self.scheduler.scale_noise(init_latents, timestep, noise)
        else:
            latents = latents.to(device)