Fix regex and logprob conflicts when chunked prefilling (#1703)

9e0dac1a · Liangsheng Yin · GitHub · a95d5589 · 9e0dac1a
Unverified Commit 9e0dac1a authored Oct 17, 2024 by Liangsheng Yin Committed by GitHub Oct 17, 2024
Hide whitespace changes
Inline Side-by-side

Showing with 8 additions and 8 deletions

python/sglang/srt/managers/scheduler.py python/sglang/srt/managers/scheduler.py +8 -8

No files found.
--- a/python/sglang/srt/managers/scheduler.py
+++ b/python/sglang/srt/managers/scheduler.py
@@ -789,15 +789,15 @@ class Scheduler:
                    elif not batch.decoding_reqs or req not in batch.decoding_reqs:
                        self.tree_cache.cache_unfinished_req(req)
-                if req.regex_fsm is not None:
+                    if req.regex_fsm is not None:
-                    req.regex_fsm_state = req.regex_fsm.get_next_state(
+                        req.regex_fsm_state = req.regex_fsm.get_next_state(
-                        req.regex_fsm_state, next_token_ids[i]
+                            req.regex_fsm_state, next_token_ids[i]
-                    )
+                        )
-                if req.return_logprob:
+                    if req.return_logprob:
-                    logprob_pt += self.add_logprob_return_values(
+                        logprob_pt += self.add_logprob_return_values(
-                        i, req, logprob_pt, next_token_ids, logits_output
+                            i, req, logprob_pt, next_token_ids, logits_output
-                    )
+                        )
        else:  # embedding or reward model
            assert batch.extend_num_tokens != 0
            embeddings, bid = result