[Minor] Add information for CUDA kernel.

3a6dfc39 · Haotian Tang · d6d6d2d4 · 3a6dfc39
Commit 3a6dfc39 authored Jun 02, 2023 by Haotian Tang
Hide whitespace changes
Inline Side-by-side

Showing with 11 additions and 0 deletions

awq/kernels/dequantize.cuh awq/kernels/dequantize.cuh +11 -0

No files found.
--- a/awq/kernels/dequantize.cuh
+++ b/awq/kernels/dequantize.cuh
+/*
+Modified from NVIDIA FasterTransformer: https://github.com/NVIDIA/FasterTransformer/blob/main/src/fastertransformer/cutlass_extensions/include/cutlass_extensions/interleaved_numeric_conversion.h
+@article{lin2023awq,
+  title={AWQ: Activation-aware Weight Quantization for LLM Compression and Acceleration},
+  author={Lin, Ji and Tang, Jiaming and Tang, Haotian and Yang, Shang and Dang, Xingyu and Han, Song},
+  journal={arXiv},
+  year={2023}
+}
+*/
 #pragma once