fix: don't skip first special token. (#1497)

beac8dd4 · Ricardo Lu · GitHub · 28b47d1e · beac8dd4
Unverified Commit beac8dd4 authored Oct 29, 2023 by Ricardo Lu Committed by GitHub Oct 29, 2023
Show whitespace changes
Inline Side-by-side

Showing with 5 additions and 1 deletion

vllm/transformers_utils/tokenizer.py vllm/transformers_utils/tokenizer.py +5 -1

No files found.
--- a/vllm/transformers_utils/tokenizer.py
+++ b/vllm/transformers_utils/tokenizer.py
@@ -120,6 +120,10 @@ def detokenize_incrementally(
        # tokenizers (bigger = more conservative).
        # Subtract 1 extra to account for the generated token.
        prefix_offset = max(len(output_tokens) - 6, 0)
+        # If the first new token is a special token, we can't skip 1 extra token
+        if skip_special_tokens and new_token_id in tokenizer.all_special_ids:
+            read_offset = max(len(output_tokens), 0)
+        else:
            read_offset = max(len(output_tokens) - 1, 0)
    else:
        # Put new_token_id in a list so skip_special_tokens is respected