Commits · 2e9034c998e231634a75ab74c5812e0dba2cf3a1 · OpenDAS / vllm_cscc

09 Apr, 2026 1 commit

[W8A8 Block Linear Refactor][2/N] Remove W8A8Fp8BlockLinearOp and adopt Fp8... · 2e9034c9

Maral authored Apr 09, 2026


[W8A8 Block Linear Refactor][2/N] Remove W8A8Fp8BlockLinearOp and adopt Fp8 block linear kernel selections. (#33892)
Signed-off-by: maral <maralbahari.98@gmail.com>
Signed-off-by: Maral <maralbahari.98@gmail.com>

2e9034c9

22 Dec, 2025 1 commit
- [Feature]: Support NVIDIA ModelOpt HF FP8 variants FP8_PER_CHANNEL_PER_TOKEN... · 19cc9468
  CedricHuang authored Dec 22, 2025
```
[Feature]: Support NVIDIA ModelOpt HF FP8 variants FP8_PER_CHANNEL_PER_TOKEN and FP8_PB_WO  in vLLM (#30957)
```
  19cc9468
18 Nov, 2025 1 commit
- [CI Sprint] Quantization CI Cleanup (#24130) · f6aa1226
  Alex authored Nov 18, 2025
```
Signed-off-by: Alex Yun <alexyun04@gmail.com>
```
  f6aa1226
05 Oct, 2025 1 commit
- Convert formatting to use `ruff` instead of `yapf` + `isort` (#26247) · d6953beb
  Harry Mellor authored Oct 05, 2025
```
Signed-off-by: Harry Mellor <19981378+hmellor@users.noreply.github.com>
```
  d6953beb
20 Sep, 2025 1 commit
- [V1] Support `LLM.apply_model` (#18465) · 3d9a1d2d
  Cyrus Leung authored Sep 20, 2025
```
Signed-off-by: DarkLight1337 <tlleungac@connect.ust.hk>
```
  3d9a1d2d
03 Sep, 2025 1 commit
- fix some typos (#24071) · 1bd007f2
  co63oc authored Sep 03, 2025
```
Signed-off-by: co63oc <co63oc@users.noreply.github.com>
```
  1bd007f2
21 Jul, 2025 1 commit
- Add Nvidia ModelOpt config adaptation (#19815) · 6b46c4b6
  Zhiyu authored Jul 21, 2025
```
Signed-off-by: Zhiyu Cheng <zhiyuc@nvidia.com>
```
  6b46c4b6