Update README.md

c87d6e3a · zhouxiang · 9d2a48ae · c87d6e3a
Commit c87d6e3a authored May 07, 2024 by zhouxiang
Hide whitespace changes
Inline Side-by-side

Showing with 5 additions and 0 deletions

README.md README.md +5 -0

No files found.
--- a/README.md
+++ b/README.md
@@ -13,6 +13,11 @@ LMDeploy 由 [MMDeploy](https://github.com/open-mmlab/mmdeploy) 和 [MMRazor](ht

 persistent batch 推理：进一步优化模型执行效率。
 LMdeploy官方github地址:[https://github.com/InternLM/lmdeploy](https://github.com/InternLM/lmdeploy)
+
+## 暂不支持的官方功能
+- **量化推理**：目前仅支持fp16的推理，awq-int4的权重量化和kv-cache int8推理方案暂不支持
+- **pytorch推理**：目前主要是针对turbomind后端推理进行适配，pytorch后端推理方案的支持可能不够完善，不建议使用
+
 ## 支持模型
 |     模型     | 模型并行 | FP16 |
 | :----------: | :------: | :--: |