[LoRA] Support Quantized Adapters (#30286)

Signed-off-by: Yu Gong <yu3.gong@gmail.com> Signed-off-by: wz1qqx <ziqi.wang@novita.ai> Signed-off-by: mgoin <mgoin64@gmail.com> Co-authored-by: wz1qqx <55830058+wz1qqx@users.noreply.github.com> Co-authored-by: wz1qqx <ziqi.wang@novita.ai> Co-authored-by: Michael Goin <mgoin64@gmail.com> Co-authored-by: Jee Jee Li <pandaleefree@gmail.com> Co-authored-by: Robert Shaw <114415538+robertgshaw2-redhat@users.noreply.github.com> Co-authored-by: Cyrus Leung <tlleungac@connect.ust.hk>

[LoRA] Support Quantized Adapters (#30286)
Signed-off-by: Yu Gong <yu3.gong@gmail.com> Signed-off-by: wz1qqx <ziqi.wang@novita.ai> Signed-off-by: mgoin <mgoin64@gmail.com> Co-authored-by: wz1qqx <55830058+wz1qqx@users.noreply.github.com> Co-authored-by: wz1qqx <ziqi.wang@novita.ai> Co-authored-by: Michael Goin <mgoin64@gmail.com> Co-authored-by: Jee Jee Li <pandaleefree@gmail.com> Co-authored-by: Robert Shaw <114415538+robertgshaw2-redhat@users.noreply.github.com> Co-authored-by: Cyrus Leung <tlleungac@connect.ust.hk>
a55caf6a · yugong333 · GitHub · 0e22cd61 · a55caf6a · a55caf6a
Unverified Commit a55caf6a authored Feb 20, 2026 by yugong333 Committed by GitHub Feb 20, 2026
Showing with 1040 additions and 0 deletions

vllm/lora/ops/triton_ops/__init__.py vllm/lora/ops/triton_ops/__init__.py +8 -0

vllm/lora/ops/triton_ops/fused_moe_lora_fp8_op.py vllm/lora/ops/triton_ops/fused_moe_lora_fp8_op.py +1032 -0

No files found.
--- a/vllm/lora/ops/triton_ops/__init__.py
+++ b/vllm/lora/ops/triton_ops/__init__.py
@@ -2,6 +2,11 @@
 # SPDX-FileCopyrightText: Copyright contributors to the vLLM project


+from vllm.lora.ops.triton_ops.fused_moe_lora_fp8_op import (
+    fused_moe_lora_expand_fp8,
+    fused_moe_lora_fp8,
+    fused_moe_lora_shrink_fp8,
+)
 from vllm.lora.ops.triton_ops.fused_moe_lora_op import (
    fused_moe_lora,
    fused_moe_lora_expand,
@@ -18,4 +23,7 @@ __all__ = [
    "fused_moe_lora",
    "fused_moe_lora_shrink",
    "fused_moe_lora_expand",
+    "fused_moe_lora_fp8",
+    "fused_moe_lora_shrink_fp8",
+    "fused_moe_lora_expand_fp8",
 ]
--- a/vllm/lora/ops/triton_ops/fused_moe_lora_fp8_op.py
+++ b/vllm/lora/ops/triton_ops/fused_moe_lora_fp8_op.py