K

kvpress-PyramidKV-Qwen3-8B_pytorch

PyramidKV构建金字塔形缓存结构,低层分配更多缓存,高层分配较少缓存,从而减少显存占用。