Commit f229f29b authored by luopl's avatar luopl
Browse files

Update README.md

parent e020778a
......@@ -20,7 +20,7 @@ DeepSeek-V4 系列在架构与优化方面引入了多项关键升级:
| tilelang | 0.1.7.post3+cpu.git52700923 |
推荐使用镜像:harbor.sourcefind.cn:5443/dcu/admin/base/custom:torch-2.9.0-ubuntu22.04-dtk26.04-deepseek-v4-0425
当前仅支持镜像:harbor.sourcefind.cn:5443/dcu/admin/base/custom:torch-2.9.0-ubuntu22.04-dtk26.04-deepseek-v4-0425
- 挂载地址`-v`根据实际模型情况修改
......@@ -53,7 +53,7 @@ docker run -it \
`暂无`
## 推理
### pytorch
### Pytorch
#### 单机推理
1. 模型转换与切分
......@@ -72,6 +72,9 @@ sh start_torch.sh
```
## 效果展示
**注意**:首次对话时由于kernel编译,可能会出现dtk hipcc编译警告,属于正常现象
<div align=center>
<img src="./doc/result_dcu.png"/>
</div>
......@@ -82,7 +85,7 @@ sh start_torch.sh
## 预训练权重
| 模型名称 | 权重大小 | DCU型号 | 最低卡数需求 |下载地址|
|:-----:|:----:|:------:|:------:|:----------:|
| DeepSeek-V4-Flash | 158B | BW1100 | 8 | [Hugging Face](https://huggingface.co/deepseek-ai/DeepSeek-V4-Flash) |
| DeepSeek-V4-Flash | 284B | BW1100 | 8 | [Hugging Face](https://huggingface.co/deepseek-ai/DeepSeek-V4-Flash) |
## 源码仓库及问题反馈
- https://developer.sourcefind.cn/codes/modelzoo/deepseek-v4
......
Markdown is supported
0% or .
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment