[Misc] Remove unused slot_mapping buffer (#23502)

Signed-off-by: Woosuk Kwon <woosuk.kwon@berkeley.edu>

[Misc] Remove unused slot_mapping buffer (#23502)
Signed-off-by: Woosuk Kwon <woosuk.kwon@berkeley.edu>
ad788684 · Woosuk Kwon · GitHub · e2db1164 · ad788684
Unverified Commit ad788684 authored Aug 24, 2025 by Woosuk Kwon Committed by GitHub Aug 24, 2025
Hide whitespace changes
Inline Side-by-side

Showing with 0 additions and 3 deletions

vllm/v1/worker/gpu_model_runner.py vllm/v1/worker/gpu_model_runner.py +0 -3

No files found.
--- a/vllm/v1/worker/gpu_model_runner.py
+++ b/vllm/v1/worker/gpu_model_runner.py
@@ -254,9 +254,6 @@ class GPUModelRunner(LoRAModelRunnerMixin, KVConnectorModelRunnerMixin):
        self.seq_lens = torch.zeros(self.max_num_reqs,
                                    dtype=torch.int32,
                                    device=self.device)
-        self.slot_mapping = torch.zeros(self.max_num_tokens,
-                                        dtype=torch.int64,
-                                        device=self.device)

        # None in the first PP rank. The rest are set after load_model.
        self.intermediate_tensors: Optional[IntermediateTensors] = None