SamplingParams add "spaces_between_special_tokens" argument (#392)

183df472 · ZhouXingg · GitHub · 5c5aba59 · 183df472 · 183df472
Unverified Commit 183df472 authored May 01, 2024 by ZhouXingg Committed by GitHub Apr 30, 2024
6 changed files
--- a/python/sglang/backend/runtime_endpoint.py
+++ b/python/sglang/backend/runtime_endpoint.py
@@ -107,6 +107,7 @@ class RuntimeEndpoint(BaseBackend):
                "text": s.text_,
                "sampling_params": {
                    "skip_special_tokens": global_config.skip_special_tokens_in_output,
+                    "spaces_between_special_tokens": global_config.spaces_between_special_tokens_in_out,
                    **sampling_params.to_srt_kwargs(),
                },
            }
@@ -115,6 +116,7 @@ class RuntimeEndpoint(BaseBackend):
                "text": s.text_,
                "sampling_params": {
                    "skip_special_tokens": global_config.skip_special_tokens_in_output,
+                    "spaces_between_special_tokens": global_config.spaces_between_special_tokens_in_out,
                    "dtype": "int",
                    **sampling_params.to_srt_kwargs(),
                },
@@ -145,6 +147,7 @@ class RuntimeEndpoint(BaseBackend):
                "text": s.text_,
                "sampling_params": {
                    "skip_special_tokens": global_config.skip_special_tokens_in_output,
+                    "spaces_between_special_tokens": global_config.spaces_between_special_tokens_in_out,
                    **sampling_params.to_srt_kwargs(),
                },
            }
@@ -153,6 +156,7 @@ class RuntimeEndpoint(BaseBackend):
                "text": s.text_,
                "sampling_params": {
                    "skip_special_tokens": global_config.skip_special_tokens_in_output,
+                    "spaces_between_special_tokens": global_config.spaces_between_special_tokens_in_out,
                    "dtype": "int",
                    **sampling_params.to_srt_kwargs(),
                },

--- a/python/sglang/global_config.py
+++ b/python/sglang/global_config.py
@@ -12,6 +12,7 @@ class GlobalConfig:
        # Output configs
        self.skip_special_tokens_in_output = True
+        self.spaces_between_special_tokens_in_out = True
        # Optimization configs
        self.eager_fill_image = False

--- a/python/sglang/srt/managers/detokenizer_manager.py
+++ b/python/sglang/srt/managers/detokenizer_manager.py
@@ -38,10 +38,11 @@ class DetokenizerManager:
            if isinstance(recv_obj, BatchTokenIDOut):
                output_tokens = recv_obj.output_tokens
-                # TODO(lmzheng): handle skip_special_tokens per request
+                # TODO(lmzheng): handle skip_special_tokens/spaces_between_special_tokens per request
                output_strs = self.tokenizer.batch_decode(
                    output_tokens,
                    skip_special_tokens=recv_obj.skip_special_tokens[0],
+                    spaces_between_special_tokens=recv_obj.spaces_between_special_tokens[0],
                )
                # Trim stop str

--- a/python/sglang/srt/managers/io_struct.py
+++ b/python/sglang/srt/managers/io_struct.py
@@ -97,6 +97,7 @@ class BatchTokenIDOut:
    output_and_jump_forward_strs: List[str]
    hit_stop_str: List[Optional[str]]
    skip_special_tokens: List[bool]
+    spaces_between_special_tokens: List[bool]
    meta_info: List[Dict]
    finished: List[bool]

--- a/python/sglang/srt/managers/router/model_rpc.py
+++ b/python/sglang/srt/managers/router/model_rpc.py
@@ -549,6 +549,7 @@ class ModelRpcServer:
        output_and_jump_forward_strs = []
        output_hit_stop_str = []
        output_skip_special_tokens = []
+        output_spaces_between_special_tokens = []
        output_meta_info = []
        output_finished = []
        finished_indices = []
@@ -575,6 +576,9 @@ class ModelRpcServer:
                output_skip_special_tokens.append(
                    req.sampling_params.skip_special_tokens
                )
+                output_spaces_between_special_tokens.append(
+                    req.sampling_params.spaces_between_special_tokens
+                )
                meta_info = {
                    "prompt_tokens": req.prompt_tokens,
@@ -609,6 +613,7 @@ class ModelRpcServer:
                    output_and_jump_forward_strs,
                    output_hit_stop_str,
                    output_skip_special_tokens,
+                    output_spaces_between_special_tokens,
                    output_meta_info,
                    output_finished,
                )

--- a/python/sglang/srt/sampling_params.py
+++ b/python/sglang/srt/sampling_params.py
@@ -17,6 +17,7 @@ class SamplingParams:
        presence_penalty: float = 0.0,
        ignore_eos: bool = False,
        skip_special_tokens: bool = True,
+        spaces_between_special_tokens: bool = True,
        dtype: Optional[str] = None,
        regex: Optional[str] = None,
    ) -> None:
@@ -29,6 +30,7 @@ class SamplingParams:
        self.max_new_tokens = max_new_tokens
        self.ignore_eos = ignore_eos
        self.skip_special_tokens = skip_special_tokens
+        self.spaces_between_special_tokens = spaces_between_special_tokens
        self.dtype = dtype
        self.regex = regex