[Frontend] Improve `StreamingResponse` Exception Handling (#11752)

33fc1e2e · Robert Shaw · GitHub · eba17173 · 33fc1e2e · 33fc1e2e
Unverified Commit 33fc1e2e authored Jan 05, 2025 by Robert Shaw Committed by GitHub Jan 05, 2025
Showing with 3 additions and 3 deletions

vllm/entrypoints/openai/serving_chat.py vllm/entrypoints/openai/serving_chat.py +2 -2

vllm/entrypoints/openai/serving_completion.py vllm/entrypoints/openai/serving_completion.py +1 -1

No files found.
--- a/vllm/entrypoints/openai/serving_chat.py
+++ b/vllm/entrypoints/openai/serving_chat.py
@@ -301,7 +301,7 @@ class OpenAIServingChat(OpenAIServing):
                ] * num_choices
            else:
                tool_parsers = [None] * num_choices
-        except RuntimeError as e:
+        except Exception as e:
            logger.exception("Error in tool parser creation.")
            data = self.create_streaming_error_response(str(e))
            yield f"data: {data}\n\n"
@@ -591,7 +591,7 @@ class OpenAIServingChat(OpenAIServing):
                completion_tokens=num_completion_tokens,
                total_tokens=num_prompt_tokens + num_completion_tokens)

-        except ValueError as e:
+        except Exception as e:
            # TODO: Use a vllm-specific Validation Error
            logger.exception("Error in chat completion stream generator.")
            data = self.create_streaming_error_response(str(e))

--- a/vllm/entrypoints/openai/serving_completion.py
+++ b/vllm/entrypoints/openai/serving_completion.py
@@ -371,7 +371,7 @@ class OpenAIServingCompletion(OpenAIServing):
            # report to FastAPI middleware aggregate usage across all choices
            request_metadata.final_usage_info = final_usage_info

-        except ValueError as e:
+        except Exception as e:
            # TODO: Use a vllm-specific Validation Error
            data = self.create_streaming_error_response(str(e))
            yield f"data: {data}\n\n"