Skip to content
GitLab
Menu
Projects
Groups
Snippets
Loading...
Help
Help
Support
Community forum
Keyboard shortcuts
?
Submit feedback
Contribute to GitLab
Sign in / Register
Toggle navigation
Menu
Open sidebar
ModelZoo
MiniMax-M2_vllm
Commits
e2eeadd2
Commit
e2eeadd2
authored
Nov 17, 2025
by
chenych
Browse files
Update README.
parent
55cce7ff
Changes
3
Hide whitespace changes
Inline
Side-by-side
Showing
3 changed files
with
8 additions
and
11 deletions
+8
-11
README.md
README.md
+7
-10
doc/results.png
doc/results.png
+0
-0
model.properties
model.properties
+1
-1
No files found.
README.md
View file @
e2eeadd2
...
...
@@ -5,13 +5,10 @@
## 模型简介
MiniMax-M2 重新定义了代理的效率。它是一个紧凑、快速且成本效益高的 MoE 模型(总参数量为 2300 亿,激活参数量为 100 亿),旨在在编码和代理任务中提供精英级性能,同时保持强大的通用智能。仅需 100 亿个激活参数,MiniMax-M2 就能提供当今领先模型所期望的复杂、端到端工具使用性能,但其精简的形式使其部署和扩展比以往任何时候都更容易。
-
**卓越的智能:**
根据 Artificial Analysis 的基准测试,MiniMax-M2 在数学、科学、指令执行、编码和代理工具使用方面表现出高度竞争性的通用智能。其综合得分在全球开源模型中排名第一。
-
**高级编码:**
MiniMax-M2 专为端到端开发人员工作流程设计,在多文件编辑、编码-运行-修复循环和测试验证修复方面表现出色。在 Terminal-Bench 和 (Multi-)SWE-Bench 风格任务中的强大表现证明了其在终端、IDE 和 CI 中跨语言的实际有效性。
-
**代理性能:**
MiniMax-M2 能够在 shell、浏览器、检索和代码运行器中规划和执行复杂的长周期工具链。在 BrowseComp 风格的评估中,它能够始终如一地找到难以浮现的来源,保持证据可追溯,并优雅地从不稳定步骤中恢复。
-
**高效设计:**
凭借 100 亿个激活参数(总共 2300 亿个参数),MiniMax-M2 提供了更低的延迟、更低的成本和更高的吞吐量,适用于交互式代理和批量采样——完美契合了向高度可部署但仍能在编码和代理任务中发光发热的模型转变的趋势。
-
**卓越的智能:**
根据 Artificial Analysis 的基准测试,MiniMax-M2 在数学、科学、指令执行、编码和代理工具使用方面表现出高度竞争性的通用智能。其综合得分在全球开源模型中排名第一。
-
**高级编码:**
MiniMax-M2 专为端到端开发人员工作流程设计,在多文件编辑、编码-运行-修复循环和测试验证修复方面表现出色。在 Terminal-Bench 和 (Multi-)SWE-Bench 风格任务中的强大表现证明了其在终端、IDE 和 CI 中跨语言的实际有效性。
-
**代理性能:**
MiniMax-M2 能够在 shell、浏览器、检索和代码运行器中规划和执行复杂的长周期工具链。在 BrowseComp 风格的评估中,它能够始终如一地找到难以浮现的来源,保持证据可追溯,并优雅地从不稳定步骤中恢复。
-
**高效设计:**
凭借 100 亿个激活参数(总共 2300 亿个参数),MiniMax-M2 提供了更低的延迟、更低的成本和更高的吞吐量,适用于交互式代理和批量采样——完美契合了向高度可部署但仍能在编码和代理任务中发光发热的模型转变的趋势。
<div
align=
center
>
<img
src=
"./doc/Bench.png"
/>
...
...
@@ -31,11 +28,11 @@ MiniMax-M2 重新定义了代理的效率。它是一个紧凑、快速且成本
| flash_attn | 2.6.1+das.opt1.dtk2504 |
| flash_mla | 1.0.0+das.opt1.dtk25042 |
推荐使用
镜像:
当前仅支持
镜像:
-
挂载地址
`-v`
根据实际模型情况修改
```
bash
docker run
-it
--shm-size
60g
--network
=
host
--name
minimax_m2
--privileged
--device
=
/dev/kfd
--device
=
/dev/dri
--device
=
/dev/mkfd
--group-add
video
--cap-add
=
SYS_PTRACE
--security-opt
seccomp
=
unconfined
-u
root
-v
/opt/hyhal/:/opt/hyhal/:ro
-v
/path/your_code_path/:/path/your_code_path/ image.sourcefind.cn:5000/dcu/admin/custom
/
vllm
:0.9.2
-ubuntu22.04-dtk25.04.2-py3.10-minimax-m2 bash
docker run
-it
--shm-size
60g
--network
=
host
--name
minimax_m2
--privileged
--device
=
/dev/kfd
--device
=
/dev/dri
--device
=
/dev/mkfd
--group-add
video
--cap-add
=
SYS_PTRACE
--security-opt
seccomp
=
unconfined
-u
root
-v
/opt/hyhal/:/opt/hyhal/:ro
-v
/path/your_code_path/:/path/your_code_path/ image.sourcefind.cn:5000/dcu/admin/
base/
custom
:
vllm-ubuntu22.04-dtk25.04.2-py3.10-minimax-m2 bash
```
更多镜像可前往
[
光源
](
https://sourcefind.cn/#/service-list
)
下载使用。
...
...
@@ -108,7 +105,7 @@ DCU与GPU精度一致,推理框架:vllm。
| MiniMax-M2 | 230 B | K100AI | 8 |
[
下载地址
](
https://huggingface.co/MiniMaxAI/MiniMax-M2
)
|
## 源码仓库及问题反馈
-
-
https://developer.sourcefind.cn/codes/modelzoo/minimax-m2_vllm
## 参考资料
-
https://github.com/MiniMax-AI/MiniMax-M2
doc/results.png
View replaced file @
55cce7ff
View file @
e2eeadd2
106 KB
|
W:
|
H:
233 KB
|
W:
|
H:
2-up
Swipe
Onion skin
model.properties
View file @
e2eeadd2
...
...
@@ -11,4 +11,4 @@ appScenario=代码生成
# 框架类型
frameType
=
vllm
# 加速卡类型
accelerateType
=
K100AI
accelerateType
=
K100AI
\ No newline at end of file
Write
Preview
Markdown
is supported
0%
Try again
or
attach a new file
.
Attach a file
Cancel
You are about to add
0
people
to the discussion. Proceed with caution.
Finish editing this message first!
Cancel
Please
register
or
sign in
to comment