Merge pull request #21 from weedge/fix/no_grade

lm generate add torch inference mode wrap

Merge pull request #21 from weedge/fix/no_grade
lm generate add torch inference mode wrap
9ab5ac25 · bigmoyan · GitHub · 44de67a3 · 2a850926 · 9ab5ac25
Unverified Commit 9ab5ac25 authored Apr 28, 2025 by bigmoyan Committed by GitHub Apr 28, 2025
Show whitespace changes
Inline Side-by-side

Showing with 2 additions and 0 deletions

kimia_infer/api/kimia.py kimia_infer/api/kimia.py +2 -0

No files found.
--- a/kimia_infer/api/kimia.py
+++ b/kimia_infer/api/kimia.py
@@ -48,6 +48,7 @@ class KimiAudio(object):
        self.kimia_text_audiodelaytokens = 6
        self.eod_ids = [self.extra_tokens.msg_end, self.extra_tokens.media_end]
+    @torch.inference_mode()
    def _generate_loop(
        self,
        audio_input_ids: torch.Tensor,  # input audio tokens
@@ -205,6 +206,7 @@ class KimiAudio(object):
        )
        return return_audio_tokens, return_text_tokens
+    @torch.inference_mode()
    def generate(
        self,
        chats: list[dict],