Fix handling of special tokens in decoding. (#418)

c6dfc3cd · xcnick · GitHub · 51be3651 · c6dfc3cd · c6dfc3cd
Unverified Commit c6dfc3cd authored Jul 12, 2023 by xcnick Committed by GitHub Jul 12, 2023
Hide whitespace changes
Inline Side-by-side

Showing with 6 additions and 3 deletions

vllm/engine/llm_engine.py vllm/engine/llm_engine.py +3 -2

vllm/transformers_utils/tokenizer.py vllm/transformers_utils/tokenizer.py +3 -1

No files found.
--- a/vllm/engine/llm_engine.py
+++ b/vllm/engine/llm_engine.py
@@ -276,8 +276,9 @@ class LLMEngine:
                    seq.get_last_token_id(),
                    skip_special_tokens=True,
                )
-                seq.output_tokens.append(new_token)
+                if new_token is not None:
-                seq.output_text = new_output_text
+                    seq.output_tokens.append(new_token)
+                    seq.output_text = new_output_text
    def _stop_sequences(self, seq_groups: List[SequenceGroup]) -> None:
        """Stop the finished sequences."""

--- a/vllm/transformers_utils/tokenizer.py
+++ b/vllm/transformers_utils/tokenizer.py
@@ -80,6 +80,8 @@ def detokenize_incrementally(
        new_token: The new token as a string.
        output_text: The new output text as a string.
    """
+    if skip_special_tokens and (new_token_id in tokenizer.all_special_ids):
+        return None, prev_output_tokens
    new_token = tokenizer.convert_ids_to_tokens(
        new_token_id, skip_special_tokens=skip_special_tokens)
    output_tokens = prev_output_tokens + [new_token]
@@ -99,7 +101,7 @@ def detokenize_incrementally(
    sub_texts = []
    current_sub_text = []
    for token in output_tokens:
-        if skip_special_tokens and token in tokenizer.all_special_ids:
+        if skip_special_tokens and token in tokenizer.all_special_tokens:
            continue
        if token in tokenizer.added_tokens_encoder:
            if current_sub_text: