support lru_cache

7fde7063 · helloyongyang · 7fc021e2 · 7fde7063 · 7fde7063 · 7fde7063
Commit 7fde7063 authored Apr 21, 2025 by helloyongyang
9 changed files
--- a/lightx2v/__main__.py
+++ b/lightx2v/__main__.py
@@ -347,7 +347,7 @@ if __name__ == "__main__":
    gc.collect()
    torch.cuda.empty_cache()
-    if ENABLE_GRAPH_MODE:
+    if CHECK_ENABLE_GRAPH_MODE():
        default_runner = DefaultRunner(model, inputs)
        runner = GraphRunner(default_runner)
    else:

--- a/lightx2v/models/networks/hunyuan/infer/transformer_infer.py
+++ b/lightx2v/models/networks/hunyuan/infer/transformer_infer.py
@@ -26,7 +26,7 @@ class HunyuanTransformerInfer:
    def set_scheduler(self, scheduler):
        self.scheduler = scheduler
-    @torch.compile(disable=not ENABLE_GRAPH_MODE)
+    @torch.compile(disable=not CHECK_ENABLE_GRAPH_MODE())
    def infer(self, weights, img, txt, vec, cu_seqlens_qkv, max_seqlen_qkv, freqs_cis, token_replace_vec=None, frist_frame_token_num=None):
        return self.infer_func(weights, img, txt, vec, cu_seqlens_qkv, max_seqlen_qkv, freqs_cis, token_replace_vec, frist_frame_token_num)

--- a/lightx2v/models/networks/wan/infer/transformer_infer.py
+++ b/lightx2v/models/networks/wan/infer/transformer_infer.py
@@ -35,7 +35,7 @@ class WanTransformerInfer:
        cu_seqlens_k = torch.cat([k_lens.new_zeros([1]), k_lens]).cumsum(0, dtype=torch.int32)
        return cu_seqlens_q, cu_seqlens_k, lq, lk
-    @torch.compile(disable=not ENABLE_GRAPH_MODE)
+    @torch.compile(disable=not CHECK_ENABLE_GRAPH_MODE())
    def infer(self, weights, grid_sizes, embed, x, embed0, seq_lens, freqs, context):
        return self.infer_func(weights, grid_sizes, embed, x, embed0, seq_lens, freqs, context)

--- a/lightx2v/utils/envs.py
+++ b/lightx2v/utils/envs.py
 import os
+from functools import lru_cache
-global ENABLE_PROFILING_DEBUG
+@lru_cache(maxsize=None)
-ENABLE_PROFILING_DEBUG = os.getenv("ENABLE_PROFILING_DEBUG", "false").lower() == "true"
+def CHECK_ENABLE_PROFILING_DEBUG():
+    ENABLE_PROFILING_DEBUG = os.getenv("ENABLE_PROFILING_DEBUG", "false").lower() == "true"
+    return ENABLE_PROFILING_DEBUG
-global ENABLE_GRAPH_MODE
-ENABLE_GRAPH_MODE = os.getenv("ENABLE_GRAPH_MODE", "false").lower() == "true"
+@lru_cache(maxsize=None)
+def CHECK_ENABLE_GRAPH_MODE():
+    ENABLE_GRAPH_MODE = os.getenv("ENABLE_GRAPH_MODE", "false").lower() == "true"
+    return ENABLE_GRAPH_MODE
--- a/lightx2v/utils/profiler.py
+++ b/lightx2v/utils/profiler.py
@@ -33,4 +33,4 @@ class _NullContext(ContextDecorator):
 ProfilingContext = _ProfilingContext
-ProfilingContext4Debug = _ProfilingContext if ENABLE_PROFILING_DEBUG else _NullContext
+ProfilingContext4Debug = _ProfilingContext if CHECK_ENABLE_PROFILING_DEBUG() else _NullContext
--- a/scripts/run_hunyuan_i2v.sh
+++ b/scripts/run_hunyuan_i2v.sh
@@ -24,6 +24,7 @@ fi
 export PYTHONPATH=${lightx2v_path}:$PYTHONPATH
 export ENABLE_PROFILING_DEBUG=true
+export ENABLE_GRAPH_MODE=false
 python ${lightx2v_path}/lightx2v/__main__.py \
 --model_cls hunyuan \

--- a/scripts/run_hunyuan_t2v.sh
+++ b/scripts/run_hunyuan_t2v.sh
@@ -24,6 +24,7 @@ fi
 export PYTHONPATH=${lightx2v_path}:$PYTHONPATH
 export ENABLE_PROFILING_DEBUG=true
+export ENABLE_GRAPH_MODE=false
 python ${lightx2v_path}/lightx2v/__main__.py \
 --model_cls hunyuan \

--- a/scripts/run_wan_i2v.sh
+++ b/scripts/run_wan_i2v.sh
@@ -30,6 +30,7 @@ fi
 export PYTHONPATH=${lightx2v_path}:$PYTHONPATH
 export ENABLE_PROFILING_DEBUG=true
+export ENABLE_GRAPH_MODE=false
 python ${lightx2v_path}/lightx2v/__main__.py \
 --model_cls wan2.1 \

--- a/scripts/run_wan_t2v.sh
+++ b/scripts/run_wan_t2v.sh
@@ -30,6 +30,7 @@ fi
 export PYTHONPATH=${lightx2v_path}:$PYTHONPATH
 export ENABLE_PROFILING_DEBUG=true
+export ENABLE_GRAPH_MODE=false
 python ${lightx2v_path}/lightx2v/__main__.py \
 --model_cls wan2.1 \