vllm/model_executor/layers/quantization/mxfp4.py · 5a1271d83a65be5ed8dc3e4c990ed42074197db3 · OpenDAS / vllm_cscc · GitLab

Find file Blame History Permalink

[Quantization] fix attention quantization of gpt_oss model (#27334) · 5a1271d8
xuebwang-amd authored Nov 12, 2025
```
Signed-off-by: xuebwang-amd <xuebwang@amd.com>
```
5a1271d8

mxfp4.py 45.6 KB