vllm/model_executor/layers/quantization/mxfp4.py · 0efdb5c3bad240121d91083189565df0b82502c2 · OpenDAS / vllm_cscc · GitLab

Find file Blame History Permalink

[gpt-oss] Cache permute indices for faster MXFP4 MoE layer loading (#24154) · 0efdb5c3
Wei authored Sep 09, 2025
```
Signed-off-by: Wei Wei <wwei6@meta.com>
```
0efdb5c3

mxfp4.py 30.5 KB