fix(dynamo-run): Fix naming the model in single-process mode (#3955)

Signed-off-by: Graham King <grahamk@nvidia.com>

fix(dynamo-run): Fix naming the model in single-process mode (#3955)
Signed-off-by: Graham King <grahamk@nvidia.com>
efa647b7 · Graham King · GitHub · a430bbb6 · efa647b7
Unverified Commit efa647b7 authored Oct 29, 2025 by Graham King Committed by GitHub Oct 29, 2025
Hide whitespace changes
Inline Side-by-side

Showing with 4 additions and 4 deletions

lib/llm/src/entrypoint/input/http.rs lib/llm/src/entrypoint/input/http.rs +4 -4

No files found.
--- a/lib/llm/src/entrypoint/input/http.rs
+++ b/lib/llm/src/entrypoint/input/http.rs
@@ -174,8 +174,8 @@ pub async fn run(runtime: Runtime, engine_config: EngineConfig) -> anyhow::Resul
            let engine = Arc::new(StreamingEngineAdapter::new(engine));
            let manager = http_service.model_manager();
            let checksum = model.card().mdcsum();
-            manager.add_completions_model(model.service_name(), checksum, engine.clone())?;
-            manager.add_chat_completions_model(model.service_name(), checksum, engine)?;
+            manager.add_completions_model(model.display_name(), checksum, engine.clone())?;
+            manager.add_chat_completions_model(model.display_name(), checksum, engine)?;

            // Enable all endpoints
            for endpoint_type in EndpointType::all() {
@@ -199,14 +199,14 @@ pub async fn run(runtime: Runtime, engine_config: EngineConfig) -> anyhow::Resul
                    NvCreateChatCompletionStreamResponse,
                >(model.card(), inner_engine.clone(), tokenizer_hf.clone())
                .await?;
-            manager.add_chat_completions_model(model.service_name(), checksum, chat_pipeline)?;
+            manager.add_chat_completions_model(model.display_name(), checksum, chat_pipeline)?;

            let cmpl_pipeline = common::build_pipeline::<
                NvCreateCompletionRequest,
                NvCreateCompletionResponse,
            >(model.card(), inner_engine, tokenizer_hf)
            .await?;
-            manager.add_completions_model(model.service_name(), checksum, cmpl_pipeline)?;
+            manager.add_completions_model(model.display_name(), checksum, cmpl_pipeline)?;
            // Enable all endpoints
            for endpoint_type in EndpointType::all() {
                http_service.enable_model_endpoint(endpoint_type, true);