Merge branch 'v0.14.1-dev_yql_2.33' into 'v0.14.1-dev'
修复awq的triton支持,和moe模型的接口bug,以及awq_moe_marlin的接口相关问题,以及解决一些w4a16的精度问题 See merge request dcutoolkit/deeplearing/vllm!403
Showing
Please register or sign in to comment
修复awq的triton支持,和moe模型的接口bug,以及awq_moe_marlin的接口相关问题,以及解决一些w4a16的精度问题 See merge request dcutoolkit/deeplearing/vllm!403