Blame · ollama/llm/llama.cpp/ggml-cuda/fattn.cuh · ff27a8172ae24bbcff76eec4220c3081852c201b · wangkx1 / ollama_dcu · GitLab

Switch branch/tag

ollama_dcu

ollama

llm

llama.cpp

ggml-cuda

fattn.cuh
Find file
Normal viewHistoryPermalink

fattn.cuh

106 Bytes

Newer

Older

init

wangkx1
committed
Aug 13, 2024

#include "common.cuh"

void ggml_cuda_flash_attn_ext(ggml_backend_cuda_context & ctx, ggml_tensor * dst);