issue/199 fix evaluation metric

8b6fb721 · wangpengcheng · 571e0ba0 · 8b6fb721
Commit 8b6fb721 authored Jan 23, 2026 by wangpengcheng
Show whitespace changes
Inline Side-by-side

Showing with 2 additions and 2 deletions

python/infinilm/infer_engine.py python/infinilm/infer_engine.py +2 -2

No files found.
--- a/python/infinilm/infer_engine.py
+++ b/python/infinilm/infer_engine.py
@@ -223,11 +223,11 @@ class InferEngine(_infinilm.InferEngine):
                f" Batchsize={initial_batch_size}  Per_Batch_Input_Len={initial_seqlen}  Per_Batch_New_Tokens={len(time_measurements)}\n"
            )
            print(
-                f" Prefill TTFT: {round(time_measurements[0], 2)}ms  Throughput: {round((initial_batch_size * initial_seqlen) / time_measurements[0], 2)}tok/s\n",
+                f" Prefill TTFT: {round(time_measurements[0] * 1000, 2)} ms  Throughput: {round((initial_batch_size * initial_seqlen) / time_measurements[0], 2)} tok/s\n",
            )
            if len(time_measurements) > 1:
                print(
-                    f" Decode  Avg ITL: {round(sum(time_measurements[1:]) * 1000 / (len(time_measurements) - 1), 2)}ms   Throughput: {round((initial_batch_size * (len(time_measurements) - 1)) / sum(time_measurements[1:]), 2)}tok/s\n",
+                    f" Decode  Avg ITL: {round(sum(time_measurements[1:]) * 1000 / (len(time_measurements) - 1), 2)} ms   Throughput: {round((initial_batch_size * (len(time_measurements) - 1)) / sum(time_measurements[1:]), 2)} tok/s\n",
                )

        return output_ids