[fix]修复llm_engine.py 越界报错

acdbc978 · 王敏 · 6ebda263 · acdbc978
Commit acdbc978 authored Dec 03, 2024 by 王敏
Hide whitespace changes
Inline Side-by-side

Showing with 10 additions and 9 deletions

vllm/engine/llm_engine.py vllm/engine/llm_engine.py +10 -9

No files found.
--- a/vllm/engine/llm_engine.py
+++ b/vllm/engine/llm_engine.py
@@ -989,15 +989,16 @@ class LLMEngine:
                output = [outputs_by_sequence_group[0][i]]
            # tree style speculative decoding may generate empty output in first step
-            if outputs and isinstance(output[0], CompletionSequenceGroupOutput):
+            if self.speculative_config and self.speculative_config.tree_style_spec_decoding:
-                samples = [o.samples[0] for o in output]
+                if outputs and isinstance(output[0], CompletionSequenceGroupOutput):
-                valid_samples = [
+                    samples = [o.samples[0] for o in output]
-                    sample for sample in samples
+                    valid_samples = [
-                    if sample.output_token != VLLM_INVALID_TOKEN_ID
+                        sample for sample in samples
-                ]
+                        if sample.output_token != VLLM_INVALID_TOKEN_ID
-                if len(valid_samples) == 0:
+                    ]
-                    empty_seq_indices.append(i)
+                    if len(valid_samples) == 0:
-                    continue
+                        empty_seq_indices.append(i)
+                        continue
            if not is_async:
                seq_group.update_num_computed_tokens(