[CI/Build] Fix `test_defaults_with_usage_context` in AMD CI (#27926)

Signed-off-by: zhewenli <zhewenli@meta.com>

[CI/Build] Fix `test_defaults_with_usage_context` in AMD CI (#27926)
Signed-off-by: zhewenli <zhewenli@meta.com>
0b8e871e · Zhewen Li · GitHub · 5ee93a59 · 0b8e871e
Unverified Commit 0b8e871e authored Nov 05, 2025 by Zhewen Li Committed by GitHub Nov 05, 2025
Hide whitespace changes
Inline Side-by-side

Showing with 4 additions and 2 deletions

tests/v1/engine/test_engine_args.py tests/v1/engine/test_engine_args.py +4 -2

No files found.
--- a/tests/v1/engine/test_engine_args.py
+++ b/tests/v1/engine/test_engine_args.py
@@ -53,10 +53,12 @@ def test_defaults_with_usage_context():
    vllm_config: VllmConfig = engine_args.create_engine_config(UsageContext.LLM_CLASS)
    from vllm.platforms import current_platform
+    from vllm.utils.mem_constants import GiB_bytes
+    device_memory = current_platform.get_device_total_memory()
    device_name = current_platform.get_device_name().lower()
-    if "h100" in device_name or "h200" in device_name:
+    if device_memory >= 70 * GiB_bytes and "a100" not in device_name:
-        # For H100 and H200, we use larger default values.
+        # For GPUs like H100, H200, and MI300x with >= 70GB memory
        default_llm_tokens = 16384
        default_server_tokens = 8192
        default_max_num_seqs = 1024