fix: add kv transfer config to planner vllm examples (#7163)

Signed-off-by: hongkuanz <hongkuanz@nvidia.com>

fix: add kv transfer config to planner vllm examples (#7163)
Signed-off-by: hongkuanz <hongkuanz@nvidia.com>
e4865b69 · Hongkuan Zhou · GitHub · 6634f33f · e4865b69 · e4865b69
Unverified Commit e4865b69 authored Mar 10, 2026 by Hongkuan Zhou Committed by GitHub Mar 10, 2026
3 changed files
--- a/tests/planner/perf_test_configs/disagg_8b_planner.yaml
+++ b/tests/planner/perf_test_configs/disagg_8b_planner.yaml
@@ -190,6 +190,8 @@ spec:
            - nvidia/Llama-3.1-8B-Instruct-FP8
            - --disaggregation-mode
            - prefill
+            - --kv-transfer-config
+            - '{"kv_connector":"NixlConnector","kv_role":"kv_both"}'
            - --no-enable-prefix-caching
            - --block-size
            - "128"
--- a/tests/planner/scaling/disagg_planner_load.yaml
+++ b/tests/planner/scaling/disagg_planner_load.yaml
@@ -74,3 +74,5 @@ spec:
            - nvidia/Llama-3.1-8B-Instruct-FP8
            - --disaggregation-mode
            - prefill
+            - --kv-transfer-config
+            - '{"kv_connector":"NixlConnector","kv_role":"kv_both"}'
--- a/tests/planner/scaling/disagg_planner_throughput.yaml
+++ b/tests/planner/scaling/disagg_planner_throughput.yaml
@@ -68,3 +68,5 @@ spec:
            - nvidia/Llama-3.1-8B-Instruct-FP8
            - --disaggregation-mode
            - prefill
+            - --kv-transfer-config
+            - '{"kv_connector":"NixlConnector","kv_role":"kv_both"}'