Merge tag 'v0.8.3' into v0.8.3-ori

675ba75f · zhuwenwen · 5cc98918 · 296c6572 · 675ba75f
Commit 675ba75f authored Apr 07, 2025 by zhuwenwen
Hide whitespace changes
Inline Side-by-side

Showing with 3 additions and 3 deletions

vllm/worker/xpu_model_runner.py vllm/worker/xpu_model_runner.py +3 -3

No files found.
--- a/vllm/worker/xpu_model_runner.py
+++ b/vllm/worker/xpu_model_runner.py
@@ -25,7 +25,7 @@ from vllm.multimodal import (MULTIMODAL_REGISTRY, BatchedTensorInputs,
                             MultiModalRegistry)
 from vllm.sampling_params import SamplingParams
 from vllm.sequence import IntermediateTensors, SequenceGroupMetadata
-from vllm.utils import DeviceMemoryProfiler, make_tensor_with_pad
+from vllm.utils import DeviceMemoryProfiler, GiB_bytes, make_tensor_with_pad
 from vllm.worker.model_runner import AttentionMetadata, SamplingMetadata
 from vllm.worker.model_runner_base import (
    ModelRunnerBase, ModelRunnerInputBase, ModelRunnerInputBuilderBase,
@@ -422,8 +422,8 @@ class XPUModelRunner(ModelRunnerBase[ModelInputForXPUWithSamplingMetadata]):
            self.model = get_model(vllm_config=self.vllm_config)
        self.model_memory_usage = m.consumed_memory
-        logger.info("Loading model weights took %.4f GB",
+        logger.info("Loading model weights took %.4f GiB",
-                    self.model_memory_usage / float(2**30))
+                    self.model_memory_usage / GiB_bytes)
    def get_model(self) -> nn.Module:
        return self.model