chore: Rename dynamo.ingress to dynamo.frontend (#1944)

5ca570f9 · Graham King · GitHub · 7b9182fd · 5ca570f9 · 5ca570f9
Unverified Commit 5ca570f9 authored Jul 15, 2025 by Graham King Committed by GitHub Jul 15, 2025
5 changed files
--- a/components/ingress/README
+++ b/components/ingress/README
-# Dynamo ingress / frontend node.
+# Dynamo frontend node.
-Usage: `python -m dynamo.ingress [--http-port <port>]`. Port defaults to 8080.
+Usage: `python -m dynamo.frontend [--http-port 8080]`.
 This runs an OpenAI compliant HTTP server, a pre-processor, and a router in a single process. Engines / workers are auto-discovered when they call `register_llm`.

--- a/components/ingress/src/dynamo/ingress/__init__.py
+++ b/components/ingress/src/dynamo/ingress/__init__.py
--- a/components/ingress/src/dynamo/ingress/__main__.py
+++ b/components/ingress/src/dynamo/ingress/__main__.py
 #  SPDX-FileCopyrightText: Copyright (c) 2025 NVIDIA CORPORATION & AFFILIATES. All rights reserved.
 #  SPDX-License-Identifier: Apache-2.0
-from dynamo.ingress.main import main
+from dynamo.frontend.main import main
 if __name__ == "__main__":
    main()
--- a/components/ingress/src/dynamo/ingress/main.py
+++ b/components/ingress/src/dynamo/ingress/main.py
 #  SPDX-FileCopyrightText: Copyright (c) 2025 NVIDIA CORPORATION & AFFILIATES. All rights reserved.
 #  SPDX-License-Identifier: Apache-2.0
-# Usage: `python -m dynamo.ingress [args]`
+# Usage: `python -m dynamo.frontend [args]`
 #
 # Start a frontend node. This runs:
 # - OpenAI HTTP server.
@@ -23,19 +23,16 @@ def parse_args():
        description="Dynamo Frontend: HTTP+Pre-processor+Router",
        formatter_class=argparse.RawTextHelpFormatter,  # To preserve multi-line help formatting
    )
+    parser.add_argument(
+        "-i", "--interactive", action="store_true", help="Interactive text chat"
+    )
    parser.add_argument(
        "--kv-cache-block-size", type=int, help="KV cache block size (u32)."
    )
    parser.add_argument(
        "--http-port", type=int, default=8080, help="HTTP port for the engine (u16)."
    )
-    flags = parser.parse_args()
+    return parser.parse_args()
-    kwargs = {"http_port": flags.http_port}
-    if flags.kv_cache_block_size is not None:
-        kwargs["kv_cache_block_size"] = flags.kv_cache_block_size
-    return kwargs
 async def async_main():
@@ -43,11 +40,17 @@ async def async_main():
    flags = parse_args()
    # out=dyn
-    e = EntrypointArgs(EngineType.Dynamic, **flags)
+    e = EntrypointArgs(
+        EngineType.Dynamic,
+        http_port=flags.http_port,
+        kv_cache_block_size=flags.kv_cache_block_size,
+    )
    engine = await make_engine(runtime, e)
-    # in=http
    try:
+        if flags.interactive:
+            await run_input(runtime, "text", engine)
+        else:
            await run_input(runtime, "http", engine)
    except asyncio.exceptions.CancelledError:
        pass

--- a/pyproject.toml
+++ b/pyproject.toml
@@ -79,7 +79,7 @@ requires = ["hatchling"]
 build-backend = "hatchling.build"
 [tool.hatch.build.targets.wheel]
-packages = ["deploy/sdk/src/dynamo", "components/planner/src/dynamo", "components/ingress/src/dynamo", "components/backends/llama_cpp/src/dynamo"]
+packages = ["deploy/sdk/src/dynamo", "components/planner/src/dynamo", "components/frontend/src/dynamo", "components/backends/llama_cpp/src/dynamo"]
 # This section is for including the binaries in the wheel package
 # but doesn't make them executable scripts in the venv bin directory