# BgGPT-Gemma-3
## 论文
暂无
## 模型简介
BgGPT 3.0 是由INSAIT开发的一系列基于 Gemma 3架构并针对保加利亚语优化的大型语言模型,提供 40 亿、120 亿和 270 亿参数三种规模。
相较于 BgGPT 2.0 的主要改进:
- 视觉 - 语言理解 —— 模型能够在同一上下文中理解文本和图像。
- 指令遵循 —— 基于更广泛的任务、多轮对话、复杂指令和系统提示进行训练。
- 更长上下文 —— 支持长达 131k token 的有效上下文,适用于更长的对话和复杂指令。
- 更新的知识截止日期 —— 预训练数据截至 2025 年 5 月,指令微调数据截至 2025 年 10 月。
## 环境依赖
| **软件** | **版本** |
| :----------: | :------------------------------------------------: |
| DTK | 26.04 |
| python | 3.10.12 |
| transformers | 5.2.0.dev0 |
| vllm | 0.15.1+das.opt1.alpha.dtk2604 |
| triton | 3.3.0+das.opt2.dtk2604.torch291.20260210.g1329924c |
| torch | 22.9.0+das.opt1.dtk2604.20260206.g275d08c2 |
| numpy | 1.26.1 |
当前仅支持以下镜像: `harbor.sourcefind.cn:5443/dcu/admin/base/custom:vllm0.15.1-ubuntu22.04-dtk26.04-0130-py3.10-20260220`
- 挂载地址`-v` 根据实际模型情况修改
```
docker run -it --shm-size 200g \
--network=host \
--name BgGPT-Gemma \
--privileged \
--device=/dev/kfd \
--device=/dev/dri \
--device=/dev/mkfd \
--group-add video \
--cap-add=SYS_PTRACE \
--security-opt seccomp=unconfined \
-u root \
-v /opt/hyhal/:/opt/hyhal/:ro \
harbor.sourcefind.cn:5443/dcu/admin/base/custom:vllm0.15.1-ubuntu22.04-dtk26.04-0130-py3.10-20260220 bash
```
更多镜像可前往[光源](https://sourcefind.cn/#/service-list)下载使用。
关于本项目DCU显卡所需的特殊深度学习库可从[光合](https://developer.sourcefind.cn/tool/)开发者社区下载安装,numpy、vllm 库需要替换安装:
```
pip uninstall vllm
pip uninstall numpy
pip install vllm-0.15.1+das.opt1.alpha.dtk2604-cp310-cp310-linux_x86_64.whl
pip install numpy==1.26.1
```
## 数据集
暂无
## 训练
暂无
## 推理
### vllm
#### 单机推理
```
## serve启动
vllm serve INSAIT-Institute/BgGPT-Gemma-3-27B-IT --trust-remote-code --dtype bfloat16 -tp 2 --port 8010
## client访问
curl -X POST "http://localhost:8010/v1/chat/completions" -H "Content-Type: application/json" --data '{
"model": "INSAIT-Institute/BgGPT-Gemma-3-27B-IT",
"messages": [
{
"role": "user",
"content": "中国的首都是什么"
}
]
}'
```
## 效果展示
### 精度
DCU 与 GPU 精度一致,推理框架:vllm。
## 预训练权重
| **模型名称** | **权重大小** | **DCU型号** | **最低卡数需求** | **下载地址** |
| :-----------------------------: | :----------: | :-----------: | :--------------: | :----------------------------------------------------------: |
| BgGPT-Gemma-3-27B-IT | 27B | BW1000 | 2 | [Hugging Face](https://huggingface.co/INSAIT-Institute/BgGPT-Gemma-3-27B-IT) |
## 源码仓库及问题反馈
- https://developer.sourcefind.cn/codes/modelzoo/bggpt-gemma-3_vllm
## 参考资料
- https://models.bggpt.ai/blog/bggpt-3-release-en/