1、pcie 解决custom cudagraph模式需要拷贝的问题,这个需要配合dtk进行使用。
vllm:export VLLM_CUSTOM_CACHE=1 dtk:export HIP_KERNEL_EVENT_SYSTENFENCE=1 2、kvcache支持fp8
Showing
Please register or sign in to comment
vllm:export VLLM_CUSTOM_CACHE=1 dtk:export HIP_KERNEL_EVENT_SYSTENFENCE=1 2、kvcache支持fp8