Commit 40ebf755 authored by luopl's avatar luopl
Browse files

add BW1000

parent 64678777
...@@ -143,10 +143,10 @@ curl http://localhost:8001/v1/chat/completions \ ...@@ -143,10 +143,10 @@ curl http://localhost:8001/v1/chat/completions \
DCU与GPU精度一致,推理框架:vllm。 DCU与GPU精度一致,推理框架:vllm。
## 预训练权重 ## 预训练权重
| 模型名称 | 权重大小 | DCU型号 | 最低卡数需求 | 下载地址 | | 模型名称 | 权重大小 | DCU型号 | 最低卡数需求 | 下载地址 |
|:------:|:----:|:------:|:------:|:---------------------:| |:------:|:----:|:-------------:|:------:|:---------------------:|
| Step-3.5-Flash | 199B | BW1100 | 4 | [Hugging Face](https://huggingface.co/stepfun-ai/Step-3.5-Flash) | | Step-3.5-Flash | 199B | BW1000,BW1100 | 4 | [Hugging Face](https://huggingface.co/stepfun-ai/Step-3.5-Flash) |
| Step-3.5-Flash-FP8 | 199B | BW1100 | 2 | [Hugging Face](https://huggingface.co/stepfun-ai/Step-3.5-Flash-FP8) | | Step-3.5-Flash-FP8 | 199B | BW1100 | 2 | [Hugging Face](https://huggingface.co/stepfun-ai/Step-3.5-Flash-FP8) |
## 源码仓库及问题反馈 ## 源码仓库及问题反馈
- https://developer.sourcefind.cn/codes/modelzoo/step-3.5-flash_vllm - https://developer.sourcefind.cn/codes/modelzoo/step-3.5-flash_vllm
......
...@@ -11,4 +11,4 @@ appCategory=对话问答 ...@@ -11,4 +11,4 @@ appCategory=对话问答
# 框架类型 # 框架类型
frameType=vllm frameType=vllm
# 加速卡类型 # 加速卡类型
accelerateType=BW1100 accelerateType=BW1000,BW1100
Markdown is supported
0% or .
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment