Consolidate Llama model usage in tests (#13094)

f2b20fe4 · Harry Mellor · GitHub · 40932d7a · f2b20fe4 · f2b20fe4
Unverified Commit f2b20fe4 authored Feb 14, 2025 by Harry Mellor Committed by GitHub Feb 13, 2025
Show whitespace changes
Inline Side-by-side

Showing with 2 additions and 2 deletions

tests/v1/sample/test_logprobs.py tests/v1/sample/test_logprobs.py +1 -1

tests/v1/sample/test_logprobs_e2e.py tests/v1/sample/test_logprobs_e2e.py +1 -1

No files found.
--- a/tests/v1/sample/test_logprobs.py
+++ b/tests/v1/sample/test_logprobs.py
@@ -14,7 +14,7 @@ from vllm import SamplingParams
 from ...conftest import VllmRunner
-MODEL = "meta-llama/Llama-3.2-1B"
+MODEL = "meta-llama/Llama-3.2-1B-Instruct"
 DTYPE = "half"

--- a/tests/v1/sample/test_logprobs_e2e.py
+++ b/tests/v1/sample/test_logprobs_e2e.py
@@ -11,7 +11,7 @@ RTOL = 0.03
 EXPECTED_VALUE = 0.62
 # FIXME(rob): enable prefix caching once supported.
-MODEL = "meta-llama/Llama-3.2-1B"
+MODEL = "meta-llama/Llama-3.2-1B-Instruct"
 MODEL_ARGS = f"pretrained={MODEL},enforce_eager=True,enable_prefix_caching=False"  # noqa: E501
 SERVER_ARGS = [
    "--enforce_eager", "--no_enable_prefix_caching", "--disable-log-requests"