README.md 3.02 KB
Newer Older
zzg_666's avatar
zzg_666 committed
1
2
3
4
5
6
# CURE-MED
## 论文
[CURE-MED](https://arxiv.org/abs/2601.13262)

## 模型简介
CURE-MED-14B属于CURE-MED模型系列,致力于解决大语言模型在多语言医疗推理领域面临的挑战。它以Qwen/Qwen2.5-14B-Instruct为基座,采用课程式强化学习方法,融合了代码切换感知的监督微调与群体相对策略优化,以提升模型在13种语言(包括阿姆哈拉语、约鲁巴语、斯瓦希里语等资源稀缺语言)上对开放式医学问答的性能表现。模型的训练与评估均基于CUREMED-BENCH——一个高质量、多语言、开放式医疗推理基准数据集,其中每个问题均具有唯一可验证答案。
zzg_666's avatar
修改  
zzg_666 committed
7
8
9
        <div align=center>
        <img src="./doc/perf.jpg"/>
        </div>
zzg_666's avatar
zzg_666 committed
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
## 环境依赖

| 软件 | 版本 |
| :------: | :------: |
| DTK | 25.04.2 |
| python | 3.10.12 |
| transformers | >=4.57.1 |
| vllm | 0.11.0+das.opt1.alpha.dtk25042.20251225.gca4598a4 |
| torch | 2.5.1+das.opt1.dtk25042 |
| triton | 3.1.0+das.opt1.dtk25042.20251224.gaa867475 |


推荐使用镜像:harbor.sourcefind.cn:5443/dcu/admin/base/vllm:0.11.0-ubuntu22.04-dtk25.04.2-tx-1226-das1.7-py3.10-20251226
- 挂载地址`-v`根据实际模型情况修改

```bash
docker run -it --shm-size 60g --network=host --name CURE-MED --privileged --device=/dev/kfd --device=/dev/dri --device=/dev/mkfd --group-add video --cap-add=SYS_PTRACE --security-opt seccomp=unconfined -u root -v /opt/hyhal/:/opt/hyhal/:ro -v /path/your_code_path/:/path/your_code_path/  harbor.sourcefind.cn:5443/dcu/admin/base/vllm:0.11.0-ubuntu22.04-dtk25.04.2-tx-1226-das1.7-py3.10-20251226 bash
```
更多镜像可前往[光源](https://sourcefind.cn/#/service-list)下载使用。

关于本项目DCU显卡所需的特殊深度学习库可从[光合](https://developer.sourcefind.cn/tool/)开发者社区下载安装。

## 数据集
暂无

## 训练
暂无

## 推理

### vllm
#### 单机推理

```bash
## serve启动
可参考vllm_serve.sh脚本
vllm serve Aikyam-Lab/CURE-MED-14B  --trust-remote-code --dtype bfloat16 -tp 1 --max-model-len 32768 --port 8010
## client访问
可参考vllm_cilent.sh
curl -X POST "http://localhost:8010/v1/chat/completions"      -H "Content-Type: application/json"     --data '{
                "model": "Aikyam-Lab/CURE-MED-14B",
                "messages": [
                        {
                                "role": "user",
                                "content": "请介绍下自己"
                        }
                ]
        }'


```

## 效果展示
<div align=center>
    <img src="./doc/result.png"/>
</div>

### 精度
DCU与GPU精度一致,推理框架:vllm。

## 预训练权重
| 模型名称  | 权重大小  | DCU型号  | 最低卡数需求 |下载地址|
|:-----:|:----------:|:----------:|:---------------------:|:----------:|
| CURE-MED-14B | 14B | K100AI | 1 | [下载地址](https://huggingface.co/Aikyam-Lab/CURE-MED-14B) |

## 源码仓库及问题反馈
- https://developer.sourcefind.cn/codes/modelzoo/cure-med_vllm

## 参考资料
- https://github.com/AikyamLab/cure-med