[Bugfix][CI/Build] Fix failing pooling models test due to Triton kernel accuracy diff (#31776)

Signed-off-by: Isotr0py <mozf@mail2.sysu.edu.cn>

[Bugfix][CI/Build] Fix failing pooling models test due to Triton kernel accuracy diff (#31776)
Signed-off-by: Isotr0py <mozf@mail2.sysu.edu.cn>
ee2e69d6 · Isotr0py · GitHub · 7101e085 · ee2e69d6
Unverified Commit ee2e69d6 authored Jan 06, 2026 by Isotr0py Committed by GitHub Jan 06, 2026
Hide whitespace changes
Inline Side-by-side

Showing with 1 addition and 1 deletion

tests/models/language/pooling/test_token_classification.py tests/models/language/pooling/test_token_classification.py +1 -1

No files found.
--- a/tests/models/language/pooling/test_token_classification.py
+++ b/tests/models/language/pooling/test_token_classification.py
@@ -78,7 +78,7 @@ def test_modernbert_models(
    for hf_output, vllm_output in zip(hf_outputs, vllm_outputs):
        hf_output = hf_output.detach().clone().cpu().float()
        vllm_output = vllm_output.detach().clone().cpu().float()
-        assert torch.allclose(hf_output, vllm_output, atol=1e-2)
+        torch.testing.assert_close(hf_output, vllm_output, atol=1.2e-2, rtol=1e-3)
 @pytest.mark.parametrize("model", ["bd2lcco/Qwen3-0.6B-finetuned"])