[Misc] Add Qwen2MoeForCausalLM moe tuning support (#14276)

Signed-off-by: Jee Jee Li <pandaleefree@gmail.com>

[Misc] Add Qwen2MoeForCausalLM moe tuning support (#14276)
Signed-off-by: Jee Jee Li <pandaleefree@gmail.com>
7bab4bb0 · Jee Jee Li · GitHub · e17e4488 · 7bab4bb0
Unverified Commit 7bab4bb0 authored Mar 05, 2025 by Jee Jee Li Committed by GitHub Mar 05, 2025
Show whitespace changes
Inline Side-by-side

Showing with 5 additions and 0 deletions

benchmarks/kernels/benchmark_moe.py benchmarks/kernels/benchmark_moe.py +5 -0

No files found.
--- a/benchmarks/kernels/benchmark_moe.py
+++ b/benchmarks/kernels/benchmark_moe.py
@@ -509,6 +509,11 @@ def main(args: argparse.Namespace):
        intermediate_size = config.moe_intermediate_size
        shard_intermediate_size = 2 * intermediate_size // args.tp_size
        block_quant_shape = config.quantization_config['weight_block_size']
+    elif config.architectures[0] == "Qwen2MoeForCausalLM":
+        E = config.num_experts
+        topk = config.num_experts_per_tok
+        intermediate_size = config.moe_intermediate_size
+        shard_intermediate_size = 2 * intermediate_size // args.tp_size
    else:
        # Default: Mixtral.
        E = config.num_local_experts