新增transformers推理说明

59edee96 · weishb · 997d1621 · 59edee96
Commit 59edee96 authored Jun 02, 2026 by weishb
Show whitespace changes
Inline Side-by-side

Showing with 3 additions and 1 deletion

README.md README.md +3 -1

No files found.
--- a/README.md
+++ b/README.md
@@ -109,6 +109,8 @@ response = tokenizer.decode(
 print(response)
 ```

+**如果用transformers推理Spark-Scilit-X1-13B，需要额外修改模型的config.json文件，将"_attn_implementation":"flash_attention_2"改成"_attn_implementation":"eager"**
+
 ### vLLM
 #### 单机推理
 ```bash