Merge pull request #722 from ZhangShuaiyi/remove_unused

Delete duplicate code

Merge pull request #722 from ZhangShuaiyi/remove_unused
Delete duplicate code
494469d4 · Atream · GitHub · 1264f940 · a34a25d5 · 494469d4
Unverified Commit 494469d4 authored Feb 28, 2025 by Atream Committed by GitHub Feb 28, 2025
Hide whitespace changes
Inline Side-by-side

Showing with 0 additions and 1 deletion

ktransformers/util/utils.py ktransformers/util/utils.py +0 -1

No files found.
--- a/ktransformers/util/utils.py
+++ b/ktransformers/util/utils.py
@@ -170,7 +170,6 @@ def prefill_and_generate(model, tokenizer, inputs, max_new_tokens=10000, use_cud
            past_key_values.cur_idx=cache_position
        start_time = time.time()
-        inputs_embeds = model.model.embed_tokens(inputs.to("cpu")).to(torch_device)
        if mode == "long_context":
            inputs_embeds = model.model.embed_tokens(inputs.to("cpu"))
        else: