model.properties 385 Bytes
Newer Older
chenych's avatar
chenych committed
1
2
3
4
5
6
7
8
9
10
11
12
13
14
# 模型唯一标识
modelCode=1915
# 模型名称
modelName=kimi-k2-instruct-quantized.w4a16_vllm
# 模型描述
modelDescription=kimi-k2-instruct-quantized.w4a16是通过将Kimi-K2-Instruct的权重量化为INT4数据类型而获得的。
# 运行过程
processType=推理
# 算法类别
appCategory=对话问答
# 框架类型
frameType=vllm
# 加速卡类型
accelerateType=BW1000