# 模型唯一标识 modelCode=2181 # 模型名称 modelName=kvpress-FINCH-Qwen3-8B_pytorch # 模型描述 modelDescription=Finch将context分成多块,然后依次与prompt拼接输入模型并级联起来推理,从而把完整context切小来减小显存占用。 # 运行过程 processType=推理 # 算法类别 appCategory=对话问答 # 框架类型 frameType=pytorch # 加速卡类型 accelerateType=K100AI