Upgrade FlashInfer to v0.3.0 (#24086)

Signed-off-by: Po-Han Huang <pohanh@nvidia.com> Co-authored-by: Simon Mo <simon.mo@hey.com>

Upgrade FlashInfer to v0.3.0 (#24086)
Signed-off-by: Po-Han Huang <pohanh@nvidia.com> Co-authored-by: Simon Mo <simon.mo@hey.com>
78336a0c · Po-Han Huang (NVIDIA) · GitHub · 94866d7c · 78336a0c · 78336a0c
Unverified Commit 78336a0c authored Sep 05, 2025 by Po-Han Huang (NVIDIA) Committed by GitHub Sep 04, 2025
Hide whitespace changes
Inline Side-by-side

Showing with 2 additions and 2 deletions

docker/Dockerfile docker/Dockerfile +1 -1

setup.py setup.py +1 -1

No files found.
--- a/docker/Dockerfile
+++ b/docker/Dockerfile
@@ -375,7 +375,7 @@ RUN --mount=type=bind,from=build,src=/workspace/dist,target=/vllm-workspace/dist
 # Install FlashInfer from source
 ARG FLASHINFER_GIT_REPO="https://github.com/flashinfer-ai/flashinfer.git"
 # Keep this in sync with "flashinfer" extra in setup.py
-ARG FLASHINFER_GIT_REF="v0.2.14.post1"
+ARG FLASHINFER_GIT_REF="v0.3.0"
 # Flag to control whether to compile FlashInfer AOT kernels
 # Set to "true" to enable AOT compilation:
 # docker build --build-arg FLASHINFER_AOT_COMPILE=true ...

--- a/setup.py
+++ b/setup.py
@@ -694,7 +694,7 @@ setup(
                  "mistral_common[audio]"],  # Required for audio processing
        "video": [],  # Kept for backwards compatibility
        # FlashInfer should be updated together with the Dockerfile
-        "flashinfer": ["flashinfer-python==0.2.14.post1"],
+        "flashinfer": ["flashinfer-python==0.3.0"],
        # Optional deps for AMD FP4 quantization support
        "petit-kernel": ["petit-kernel"],
    },