add loglikelihood_rolling

b56dee4e · Matt Hoffner · 97d31082 · b56dee4e · b56dee4e · b56dee4e
Commit b56dee4e authored Jun 27, 2023 by Matt Hoffner
4 changed files
--- a/lm_eval/models/ggml.py
+++ b/lm_eval/models/ggml.py
 import requests
 import logging
 import time
-from lm_eval.utils import Reorderer
-from lm_eval.base import BaseLM
 from tqdm import tqdm
 from requests.exceptions import RequestException
+from lm_eval.utils import Reorderer
+from lm_eval.base import BaseLM
 logger = logging.getLogger(__name__)
 def ggml_completion(base_url, retries=3, delay=5, **kwargs):
@@ -74,6 +75,20 @@ class GGMLLM(BaseLM):
                res.append(None)  # Add default value in case of error
        return reorderer.get_original(res)
+    def loglikelihood_rolling(self, requests):
+        results = []
+        for request in requests:
+            logprobs = []
+            for i in range(0, len(request), self.max_length):
+                chunk = request[i:i+self.max_length]
+                chunk_loglikelihood = self.loglikelihood([(chunk, request[i+1:i+self.max_length+1])])
+                logprobs.extend(chunk_loglikelihood)
+            avg_loglikelihood = sum([logprob for logprob, _ in logprobs]) / len(logprobs)
+            results.append((avg_loglikelihood, True))
+        return results
    def _model_call(self, inps):
@@ -100,9 +115,8 @@ class GGMLLM(BaseLM):
        raise NotImplementedError()
    @property
-    def max_length(self):
+    def max_length(self):        
-        # Placeholder implementation
+        return 1024
-        raise NotImplementedError()
    @property
    def max_gen_toks(self):

--- a/tests/test_ggml.py
+++ b/tests/test_ggml.py
@@ -62,5 +62,18 @@ class GGMLLMTest(unittest.TestCase):
        expected_res = ["generated text until stop1", "generated text until stop1"]
        self.assertEqual(res, expected_res)
+    @patch('lm_eval.models.ggml.ggml_completion', side_effect=ggml_completion_mock)
+    def test_loglikelihood_rolling(self, ggml_completion_mock):
+        lm = GGMLLM(base_url)
+        # Test loglikelihood_rolling
+        requests = ["input1", "input2"]
+        res = lm.loglikelihood_rolling(requests)
+        # Assert the loglikelihood_rolling response is correct
+        expected_res = [(-1.2345, True), (-1.2345, True)]
+        self.assertEqual(res, expected_res)
 if __name__ == "__main__":
    unittest.main()
--- a/tests/testdata/ggml_test_18f981234b6b471823bff9f977aad7f72439244c6c4d5f091b1f0984a71c8f11.pkl
+++ b/tests/testdata/ggml_test_18f981234b6b471823bff9f977aad7f72439244c6c4d5f091b1f0984a71c8f11.pkl
--- a/tests/testdata/ggml_test_e768167d669b5de84c99743c4b55bc85889d4894d1901d9f955626e0622059a6.pkl
+++ b/tests/testdata/ggml_test_e768167d669b5de84c99743c4b55bc85889d4894d1901d9f955626e0622059a6.pkl