csrc/models/llama/llama_attention.cpp · a256e8d9ca49b59f8b2579a8147a41c5ef6a6e87 · jerrrrry / infinilm · GitLab

Find file Blame History Permalink

add mha_kvcache (#261) · a256e8d9
suss authored Mar 11, 2026
```
* add mha_kvcache

* repair gqa-api bug
```
a256e8d9

llama_attention.cpp 20.2 KB