Update AMX.md

14efb155 · Atream · GitHub · 38333cf1 · 14efb155
Unverified Commit 14efb155 authored Apr 29, 2025 by Atream Committed by GitHub Apr 29, 2025
Hide whitespace changes
Inline Side-by-side

Showing with 2 additions and 2 deletions

doc/en/AMX.md doc/en/AMX.md +2 -2

No files found.
--- a/doc/en/AMX.md
+++ b/doc/en/AMX.md
@@ -20,9 +20,9 @@ Here is the Qwen3MoE startup command:

 ``` python
 # llamafile backend
-python ktransformers/server/main.py --architectures Qwen3MoeForCausalLM --model_path <model_dir> --gguf_path <gguf_dir> --optimize_config_path ktransformers/optimize/optimize_rules/Qwen3Moe-serve.yaml 
+python ktransformers/server/main.py --architectures Qwen3MoeForCausalLM --model_path <model_dir> --gguf_path <gguf_dir> --optimize_config_path ktransformers/optimize/optimize_rules/Qwen3Moe-serve.yaml --backend_type balance_serve
 # AMX backend
-python ktransformers/server/main.py --architectures Qwen3MoeForCausalLM --model_path <model_dir> --gguf_path <gguf_dir> --optimize_config_path ktransformers/optimize/optimize_rules/Qwen3Moe-serve-amx.yaml 
+python ktransformers/server/main.py --architectures Qwen3MoeForCausalLM --model_path <model_dir> --gguf_path <gguf_dir> --optimize_config_path ktransformers/optimize/optimize_rules/Qwen3Moe-serve-amx.yaml --backend_type balance_serve
 ```

 **Note: At present, Qwen3MoE running with AMX can only read BF16 GGUF; support for loading from safetensor will be added later.**