Commit 2619afdb authored by chenych's avatar chenych
Browse files

Update README.

parent 80303715
...@@ -76,6 +76,7 @@ vllm serve ZhipuAI/GLM-4.7-Flash \ ...@@ -76,6 +76,7 @@ vllm serve ZhipuAI/GLM-4.7-Flash \
--tool-call-parser glm47 \ --tool-call-parser glm47 \
--reasoning-parser glm45 \ --reasoning-parser glm45 \
--enable-auto-tool-choice \ --enable-auto-tool-choice \
--served-model-name glm-4.7-flash \
--port 8001 --port 8001
# client访问 # client访问
...@@ -185,8 +186,8 @@ curl http://localhost:8001/v1/chat/completions \ ...@@ -185,8 +186,8 @@ curl http://localhost:8001/v1/chat/completions \
## 预训练权重 ## 预训练权重
| 模型名称 | 权重大小 | DCU型号 | 最低卡数需求 |下载地址| | 模型名称 | 权重大小 | DCU型号 | 最低卡数需求 |下载地址|
|:-----:|:----------:|:----------:|:---------------------:|:----------:| |:-----:|:----------:|:----------:|:---------------------:|:----------:|
| GLM-4.7 | 355B-A32B | BW1000 | 16 | [Modelscope](https://modelscope.cn/models/ZhipuAI/GLM-4.7) | | GLM-4.7 | 355B | BW1000 | 16 | [Modelscope](https://modelscope.cn/models/ZhipuAI/GLM-4.7) |
| GLM-4.7-Flash| 30B-A3B | BW1000 | 2 | [Modelscope](https://modelscope.cn/models/ZhipuAI/GLM-4.7-Flash) | | GLM-4.7-Flash| 30B | BW1000 | 2 | [Modelscope](https://modelscope.cn/models/ZhipuAI/GLM-4.7-Flash) |
## 源码仓库及问题反馈 ## 源码仓库及问题反馈
- https://developer.sourcefind.cn/codes/modelzoo/glm-4.7_vllm - https://developer.sourcefind.cn/codes/modelzoo/glm-4.7_vllm
......
Markdown is supported
0% or .
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment