Merge pull request #1046 from InfiniTensor/issue/1032i

issue/1032 - fix block size on iluvatar

Merge pull request #1046 from InfiniTensor/issue/1032i
issue/1032 - fix block size on iluvatar
b2f915cb · thatPepe · GitHub · abd45713 · c3946bf0 · b2f915cb
Unverified Commit b2f915cb authored Mar 03, 2026 by thatPepe Committed by GitHub Mar 03, 2026
Hide whitespace changes
Inline Side-by-side

Showing with 5 additions and 3 deletions

src/infiniop/ops/swiglu/nvidia/swiglu_nvidia_cuda.cu src/infiniop/ops/swiglu/nvidia/swiglu_nvidia_cuda.cu +5 -3

No files found.
--- a/src/infiniop/ops/swiglu/nvidia/swiglu_nvidia_cuda.cu
+++ b/src/infiniop/ops/swiglu/nvidia/swiglu_nvidia_cuda.cu
@@ -106,10 +106,12 @@ infiniStatus_t Descriptor::calculate(
            return INFINI_STATUS_BAD_TENSOR_DTYPE;                   \
    }

-    if (_opaque->internal->maxThreadsPerBlock() == CUDA_BLOCK_SIZE_1024) {
-        CALCULATE_SWIGLU_CUDA_WITH_BLOCK_SIZE(CUDA_BLOCK_SIZE_1024)
-    } else if (_opaque->internal->maxThreadsPerBlock() == CUDA_BLOCK_SIZE_512) {
+    if (_opaque->internal->maxThreadsPerBlock() == CUDA_BLOCK_SIZE_512) {
        CALCULATE_SWIGLU_CUDA_WITH_BLOCK_SIZE(CUDA_BLOCK_SIZE_512)
+    } else if (_opaque->internal->maxThreadsPerBlock() == CUDA_BLOCK_SIZE_1024) {
+        CALCULATE_SWIGLU_CUDA_WITH_BLOCK_SIZE(CUDA_BLOCK_SIZE_1024)
+    } else if (_opaque->internal->maxThreadsPerBlock() == CUDA_BLOCK_SIZE_2048) {
+        CALCULATE_SWIGLU_CUDA_WITH_BLOCK_SIZE(CUDA_BLOCK_SIZE_2048)
    } else if (_opaque->internal->maxThreadsPerBlock() == CUDA_BLOCK_SIZE_4096) {
        CALCULATE_SWIGLU_CUDA_WITH_BLOCK_SIZE(CUDA_BLOCK_SIZE_4096)
    } else {