[CI] Bump `num_speculative_tokens` to 3 in nightly DeepSeek tests (#35882)

Signed-off-by: Matthew Bonanni <mbonanni@redhat.com>

[CI] Bump `num_speculative_tokens` to 3 in nightly DeepSeek tests (#35882)
Signed-off-by: Matthew Bonanni <mbonanni@redhat.com>
8e1fd5ba · Matthew Bonanni · GitHub · ae88468b · 8e1fd5ba · 8e1fd5ba
Unverified Commit 8e1fd5ba authored Mar 03, 2026 by Matthew Bonanni Committed by GitHub Mar 03, 2026
4 changed files
--- a/tests/evals/gsm8k/configs/DeepSeek-R1-DP.yaml
+++ b/tests/evals/gsm8k/configs/DeepSeek-R1-DP.yaml
@@ -8,4 +8,4 @@ server_args: >-
  --max-model-len 4096
  --data-parallel-size 8
  --enable-expert-parallel
-  --speculative-config '{"method":"mtp","num_speculative_tokens":1}'
+  --speculative-config '{"method":"mtp","num_speculative_tokens":3}'
--- a/tests/evals/gsm8k/configs/DeepSeek-R1-TP.yaml
+++ b/tests/evals/gsm8k/configs/DeepSeek-R1-TP.yaml
@@ -8,4 +8,4 @@ server_args: >-
  --max-model-len 4096
  --tensor-parallel-size 8
  --enable-expert-parallel
-  --speculative-config '{"method":"mtp","num_speculative_tokens":1}'
+  --speculative-config '{"method":"mtp","num_speculative_tokens":3}'
--- a/tests/evals/gsm8k/configs/DeepSeek-V3.2-DP.yaml
+++ b/tests/evals/gsm8k/configs/DeepSeek-V3.2-DP.yaml
@@ -8,4 +8,4 @@ server_args: >-
  --max-model-len 4096
  --data-parallel-size 8
  --enable-expert-parallel
-  --speculative-config '{"method":"mtp","num_speculative_tokens":1}'
+  --speculative-config '{"method":"mtp","num_speculative_tokens":3}'
--- a/tests/evals/gsm8k/configs/DeepSeek-V3.2-TP.yaml
+++ b/tests/evals/gsm8k/configs/DeepSeek-V3.2-TP.yaml
@@ -8,4 +8,4 @@ server_args: >-
  --max-model-len 4096
  --tensor-parallel-size 8
  --enable-expert-parallel
-  --speculative-config '{"method":"mtp","num_speculative_tokens":1}'
+  --speculative-config '{"method":"mtp","num_speculative_tokens":3}'