Projects · Explore

Explore GitLab

Discover projects, groups and snippets. Share your projects with others

T

tsoc / topo_tools

0 0 0 0

Updated Mar 13, 2026
D

tsoc / dcu-codec-pipeline-py

DCU 视频编解码框架ffmpeg python api demo

0 0 0 0

Updated Mar 13, 2026
K

ModelZoo / kvpress-FINCH-Qwen3-8B_pytorch
Apache License 2.0

FINCH将context分成多块，然后依次与prompt拼接输入模型并级联起来推理，从而把完整context切小来减小显存占用。

0 0 0 0

Updated Mar 12, 2026
T

OpenDAS / TransformerEngine
Apache License 2.0

0 0 0 0

Updated Mar 12, 2026
K

ModelZoo / kvpress-PyramidKV-Qwen3-8B_pytorch
Apache License 2.0

PyramidKV构建金字塔形缓存结构，低层分配更多缓存，高层分配较少缓存，从而减少显存占用。

0 0 0 0

Updated Mar 12, 2026
V

zsccc / vllm-0.15.1 安装包

0 0 0 0

Updated Mar 12, 2026
K

ModelZoo / kvpress-Knorm-Qwen3-8B_pytorch
Apache License 2.0

Knorm将key进行L_2 Norm获得scores实现剪枝，英伟达官方默认的基准算法。

0 0 0 0

Updated Mar 11, 2026
K

ModelZoo / kvpress-TOVA-Qwen3-8B_pytorch
Apache License 2.0

TOVA将Transformer视为一个无界多状态RNN，通过限制每层token数量来转换成有界RNN，允许动态驱逐最近缓存，根据当前查询需求调整保留窗口实现剪枝。

0 0 0 0

Updated Mar 11, 2026
K

ModelZoo / kvpress-SnapKV-Qwen3-8B_pytorch
Apache License 2.0

SnapKV采用近期query与key点积再池化的topk scores进行剪枝。

0 0 0 0

Updated Mar 10, 2026
S

liucong8560 / sglang-omni

0 0 0 0

Updated Mar 10, 2026
P

ModelZoo / PaddleOCR-VL-1.5_paddle

0 0 0 0

Updated Mar 09, 2026
G

ModelZoo / GLM-4.7_vllm
Apache License 2.0

0 0 0 0

Updated Mar 09, 2026
G

ModelZoo / GLM-4.6V_vllm
Apache License 2.0

0 0 0 0

Updated Mar 09, 2026
S

shihm / speech_fsmn_vad_zh-cn-16k-common-pytorch_transformers

FSMN-Monophone VAD用于检测输入音频中有效语音的起止时间点信息，并将检测出来的有效音频片段输入识别引擎进行识别，减少无效语音带来的识别错误。

0 0 0 0

Updated Mar 09, 2026
B

Jasmine Kovar / business-and-technology-consulting2019

0 0 0 1

Updated Mar 07, 2026
M

Mallory Cantu / microsoft-consultants2006

0 0 0 1

Updated Mar 06, 2026
B

Melanie Renner / business-and-technology-consulting8664

0 0 0 1

Updated Mar 06, 2026
3

Ervin Tatum / 3775microsoft-consultants

0 0 0 1

Updated Mar 06, 2026
D

tsoc / DcuProfileTools

0 0 0 0

Updated Mar 06, 2026
T

tsoc / torch_custom_op

0 0 0 0

Updated Mar 05, 2026