bugs fiexed for distill_model server

8b213df0 · GoatWu · 6ac3cee7 · 8b213df0 · 8b213df0 · 8b213df0
Commit 8b213df0 authored Jul 11, 2025 by GoatWu
5 changed files
--- a/.gitignore
+++ b/.gitignore
@@ -25,3 +25,4 @@
 build/
 dist/
 .cache/
+server_cache/
--- a/lightx2v/api_server.py
+++ b/lightx2v/api_server.py
@@ -36,6 +36,7 @@ def main():
        choices=[
            "wan2.1",
            "hunyuan",
+            "wan2.1_distill",
            "wan2.1_causvid",
            "wan2.1_skyreels_v2_df",
            "wan2.1_audio",
@@ -55,7 +56,7 @@ def main():
    args = parser.parse_args()
    logger.info(f"args: {args}")
-    cache_dir = Path(__file__).parent.parent / ".cache"
+    cache_dir = Path(__file__).parent.parent / "server_cache"
    inference_service = DistributedInferenceService()
    api_server = ApiServer()

--- a/lightx2v/models/schedulers/wan/step_distill/scheduler.py
+++ b/lightx2v/models/schedulers/wan/step_distill/scheduler.py
@@ -9,7 +9,7 @@ class WanStepDistillScheduler(WanScheduler):
    def __init__(self, config):
        super().__init__(config)
        self.denoising_step_list = config.denoising_step_list
-        self.infer_steps = self.config.infer_steps
+        self.infer_steps = len(self.denoising_step_list)
        self.sample_shift = self.config.sample_shift
    def prepare(self, image_encoder_output):
@@ -40,10 +40,7 @@ class WanStepDistillScheduler(WanScheduler):
        self.sigma_min = self.sigmas[-1].item()
        self.sigma_max = self.sigmas[0].item()
-        if len(self.denoising_step_list) == self.infer_steps:  # 如果denoising_step_list有效既使用
        self.set_denoising_timesteps(device=self.device)
-        else:
-            self.set_timesteps(self.infer_steps, device=self.device, shift=self.sample_shift)
    def set_denoising_timesteps(self, device: Union[str, torch.device] = None):
        self.timesteps = torch.tensor(self.denoising_step_list, device=device, dtype=torch.int64)

--- a/scripts/post_multi_servers.py
+++ b/scripts/post_multi_servers.py
@@ -46,12 +46,26 @@ def generate_task_id():
 def post_all_tasks(urls, messages):
    msg_num = len(messages)
    msg_index = 0
-    while True:
+    available_urls = []
    for url in urls:
-            response = requests.get(f"{url}/v1/local/video/generate/service_status").json()
+        try:
+            _ = requests.get(f"{url}/v1/service/status").json()
+        except Exception as e:
+            continue
+        available_urls.append(url)
+    if not available_urls:
+        logger.error("No available urls.")
+        return
+    logger.info(f"available_urls: {available_urls}")
+    while True:
+        for url in available_urls:
+            response = requests.get(f"{url}/v1/service/status").json()
            if response["service_status"] == "idle":
                logger.info(f"{url} service is idle, start task...")
-                response = requests.post(f"{url}/v1/local/video/generate", json=messages[msg_index])
+                response = requests.post(f"{url}/v1/tasks/", json=messages[msg_index])
                logger.info(f"response: {response.json()}")
                msg_index += 1
                if msg_index == msg_num:

--- a/scripts/server/start_server.sh
+++ b/scripts/server/start_server.sh
@@ -42,7 +42,6 @@ python -m lightx2v.api_server \
 --model_path $model_path \
 --config_json ${lightx2v_path}/configs/wan/wan_i2v_dist.json \
 --port 8000 \
--start_inference \
 --nproc_per_node 1
 echo "Service stopped"