# BgGPT-Gemma-3 ## 论文 暂无 ## 模型简介 BgGPT 3.0 是由INSAIT开发的一系列基于 Gemma 3架构并针对保加利亚语优化的大型语言模型,提供 40 亿、120 亿和 270 亿参数三种规模。 相较于 BgGPT 2.0 的主要改进: - 视觉 - 语言理解 —— 模型能够在同一上下文中理解文本和图像。 - 指令遵循 —— 基于更广泛的任务、多轮对话、复杂指令和系统提示进行训练。 - 更长上下文 —— 支持长达 131k token 的有效上下文,适用于更长的对话和复杂指令。 - 更新的知识截止日期 —— 预训练数据截至 2025 年 5 月,指令微调数据截至 2025 年 10 月。
## 环境依赖 | **软件** | **版本** | | :----------: | :------------------------------------------------: | | DTK | 26.04 | | python | 3.10.12 | | transformers | 5.2.0.dev0 | | vllm | 0.15.1+das.opt1.alpha.dtk2604 | | triton | 3.3.0+das.opt2.dtk2604.torch291.20260210.g1329924c | | torch | 22.9.0+das.opt1.dtk2604.20260206.g275d08c2 | | numpy | 1.26.1 | 当前仅支持以下镜像: `harbor.sourcefind.cn:5443/dcu/admin/base/custom:vllm0.15.1-ubuntu22.04-dtk26.04-0130-py3.10-20260220` - 挂载地址`-v` 根据实际模型情况修改 ``` docker run -it --shm-size 200g \ --network=host \ --name BgGPT-Gemma \ --privileged \ --device=/dev/kfd \ --device=/dev/dri \ --device=/dev/mkfd \ --group-add video \ --cap-add=SYS_PTRACE \ --security-opt seccomp=unconfined \ -u root \ -v /opt/hyhal/:/opt/hyhal/:ro \ harbor.sourcefind.cn:5443/dcu/admin/base/custom:vllm0.15.1-ubuntu22.04-dtk26.04-0130-py3.10-20260220 bash ``` 更多镜像可前往[光源](https://sourcefind.cn/#/service-list)下载使用。 关于本项目DCU显卡所需的特殊深度学习库可从[光合](https://developer.sourcefind.cn/tool/)开发者社区下载安装,numpy、vllm 库需要替换安装: ``` pip uninstall vllm pip uninstall numpy pip install vllm-0.15.1+das.opt1.alpha.dtk2604-cp310-cp310-linux_x86_64.whl pip install numpy==1.26.1 ``` ## 数据集 暂无 ## 训练 暂无 ## 推理 ### vllm #### 单机推理 ``` ## serve启动 vllm serve INSAIT-Institute/BgGPT-Gemma-3-27B-IT --trust-remote-code --dtype bfloat16 -tp 2 --port 8010 ## client访问 curl -X POST "http://localhost:8010/v1/chat/completions" -H "Content-Type: application/json" --data '{ "model": "INSAIT-Institute/BgGPT-Gemma-3-27B-IT", "messages": [ { "role": "user", "content": "中国的首都是什么" } ] }' ``` ## 效果展示
### 精度 DCU 与 GPU 精度一致,推理框架:vllm。 ## 预训练权重 | **模型名称** | **权重大小** | **DCU型号** | **最低卡数需求** | **下载地址** | | :-----------------------------: | :----------: | :-----------: | :--------------: | :----------------------------------------------------------: | | BgGPT-Gemma-3-27B-IT | 27B | BW1000 | 2 | [Hugging Face](https://huggingface.co/INSAIT-Institute/BgGPT-Gemma-3-27B-IT) | ## 源码仓库及问题反馈 - https://developer.sourcefind.cn/codes/modelzoo/bggpt-gemma-3_vllm ## 参考资料 - https://models.bggpt.ai/blog/bggpt-3-release-en/