[Misc] Fix import (#20233)

Signed-off-by: Woosuk Kwon <woosuk.kwon@berkeley.edu>

[Misc] Fix import (#20233)
Signed-off-by: Woosuk Kwon <woosuk.kwon@berkeley.edu>
19108ef3 · Woosuk Kwon · GitHub · 5a52f389 · 19108ef3
Unverified Commit 19108ef3 authored Jun 29, 2025 by Woosuk Kwon Committed by GitHub Jun 29, 2025
Hide whitespace changes
Inline Side-by-side

Showing with 1 addition and 2 deletions

vllm/v1/worker/gpu_model_runner.py vllm/v1/worker/gpu_model_runner.py +1 -2

No files found.
--- a/vllm/v1/worker/gpu_model_runner.py
+++ b/vllm/v1/worker/gpu_model_runner.py
@@ -45,7 +45,7 @@ from vllm.sequence import IntermediateTensors
 from vllm.utils import (STR_DTYPE_TO_TORCH_DTYPE, DeviceMemoryProfiler,
                        GiB_bytes, LazyLoader, async_tensor_h2d, cdiv,
                        check_use_alibi, get_dtype_size,
-                        is_pin_memory_available)
+                        is_pin_memory_available, round_up)
 from vllm.v1.attention.backends.mamba_attn import Mamba2AttentionBackend
 from vllm.v1.attention.backends.utils import (AttentionMetadataBuilder,
                                              CommonAttentionMetadata)
@@ -1308,7 +1308,6 @@ class GPUModelRunner(LoRAModelRunnerMixin):
            tp_size = self.vllm_config.parallel_config.tensor_parallel_size
            if self.compilation_config.pass_config. \
                enable_sequence_parallelism and tp_size > 1:
-                from vllm.utils import round_up
                num_input_tokens = round_up(num_scheduled_tokens, tp_size)
            else:
                num_input_tokens = num_scheduled_tokens