save outputs

e947d11e · coderfeli · 9afc4a0b · e947d11e
Commit e947d11e authored Feb 05, 2025 by coderfeli
Hide whitespace changes
Inline Side-by-side

Showing with 4 additions and 2 deletions

example/65_gemm_multiply_multiply/moe_gemm_fp16.cpp example/65_gemm_multiply_multiply/moe_gemm_fp16.cpp +4 -2

No files found.
--- a/example/65_gemm_multiply_multiply/moe_gemm_fp16.cpp
+++ b/example/65_gemm_multiply_multiply/moe_gemm_fp16.cpp
@@ -80,9 +80,10 @@ struct MultiplyMultiply
    // }
 };
 void preShuffleBuffer(const F16* src, F16* dst, int N, int K, int NXdl)
 {
-    int KPack = 8;
+    int KPack = 16 / sizeof(F16);
    int NLane = NXdl;
    int KLane = 64 / NLane;
@@ -226,7 +227,8 @@ int main(int argc, char* argv[])
        else
            sorted_token_ids.mData[i] = tokens;
    }
+    expert_ids.savetxt("expert_ids.txt", "int");
+    sorted_token_ids.savetxt("sorted_token_ids.txt", "int");
    Tensor<A0DataType> a0_t_k(HostTensorDescriptor({tokens, K}, {K, 1}));
    Tensor<B0DataType> b0_e_n_k(HostTensorDescriptor({experts, N, K}, {N*K, K, 1}));
    Tensor<B0DataType> b0_preshuffled(HostTensorDescriptor({experts, N, K}, {N*K, K, 1}));