K

kvpress-SnapKV-Qwen3-8B_pytorch

SnapKV采用近期query与key点积再池化的topk scores进行剪枝。