[Fix] Fix the condition of max_seq_len (#477)

2bdea7ac · Zhuohan Li · GitHub · 58df2883 · 2bdea7ac · 2bdea7ac
Unverified Commit 2bdea7ac authored Jul 17, 2023 by Zhuohan Li Committed by GitHub Jul 17, 2023
Hide whitespace changes
Inline Side-by-side

Showing with 2 additions and 2 deletions

vllm/core/scheduler.py vllm/core/scheduler.py +1 -1

vllm/engine/llm_engine.py vllm/engine/llm_engine.py +1 -1

No files found.
--- a/vllm/core/scheduler.py
+++ b/vllm/core/scheduler.py
@@ -190,7 +190,7 @@ class Scheduler:
                    break

                num_prompt_tokens = seq_group.get_seqs()[0].get_len()
-                if num_prompt_tokens >= self.scheduler_config.max_seq_len:
+                if num_prompt_tokens > self.scheduler_config.max_seq_len:
                    logger.warning(
                        f"Input prompt ({num_prompt_tokens} tokens) is too long"
                        " and exceeds limit of "

--- a/vllm/engine/llm_engine.py
+++ b/vllm/engine/llm_engine.py
@@ -300,7 +300,7 @@ class LLMEngine:
                    continue

                # Check if the sequence has reached max_seq_len.
-                if (seq.get_len() >=
+                if (seq.get_len() >
                        self.scheduler.scheduler_config.max_seq_len):
                    self.scheduler.free_seq(
                        seq, SequenceStatus.FINISHED_LENGTH_CAPPED)