lookup-mt.cpp 3.47 KB
Newer Older
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
/**
 * @Description  :
 * @Author       : Xie Weiyu
 * @Date         : 2024-11-22 08:48:40
 * @Version      : 1.0.0
 * @LastEditors  : Xie Weiyu
 * @LastEditTime : 2024-11-22 09:53:06
 * @Copyright (c) 2024 by KVCache.AI, All Rights Reserved.
 **/

#include "common.hpp"

template <typename F>
void test_multi(F f) {
  std::vector<std::thread> threads;
  for (size_t i = 0; i < 10; i++) {
    threads.push_back([f]() { f(); });
  }
  for (auto& t : threads) {
    t.join();
  }
}

int main(int argc, char* argv[]) {
  init(argc, argv);
  spdlog::set_level(spdlog::level::debug);
  auto kvc2 = kvc2::create_kvc2(config);

  std::mt19937 gen(123);
  auto ids1 = random_ids(3 * config.num_token_per_page, gen);
  auto k1 = random_kvcache(3, gen);
  auto v1 = random_kvcache(3, gen);

  kvc2->raw_insert(test_model_name, test_quant_type, ids1.data(), ids1.size(), k1, v1);

  // complete same
  {
#pragma omp parallel for
    for (size_t i = 0; i < 10; i++) {
      auto h = kvc2->lookup(test_model_name, test_quant_type, ids1.data(), ids1.size(),
                            ids1.size() + 10 * config.num_token_per_page);
      if (h == nullptr) {
        SPDLOG_WARN("Thread[{}]: h is nullptr", i);
      } else {
        auto k = h->handle_data(true);
        auto v = h->handle_data(false);
        cmp_handle_data(k1, k, 3);
        cmp_handle_data(v1, v, 3);
      }
    }
  }

  //  // complete prefix
  //   {
  //     std::vector<Token> ids2(ids1.begin(), ids1.begin() + 3 * config.num_token_per_page);
  //     auto h = kvc2->lookup(test_model_name, test_quant_type, ids2.data(), ids2.size(), ids2.size() + 3 *
  //     config.num_token_per_page); auto k = h->handle_data(true); auto v = h->handle_data(false); cmp_handle_data(k1,
  //     k, 3); cmp_handle_data(v1, v, 3);
  //   }

  //   // common prefix
  //   {
  //     std::vector<Token> ids2(ids1.begin(), ids1.begin() + 3 * config.num_token_per_page);
  //     auto rids = random_ids(config.num_token_per_page * 2 + config.num_token_per_page / 2, gen);
  //     ids2.insert(ids2.end(), rids.begin(), rids.end());

  //     auto h = kvc2->lookup(test_model_name, test_quant_type, ids2.data(), ids2.size(), ids2.size());
  //     auto k = h->handle_data(true);
  //     auto v = h->handle_data(false);
  //     cmp_handle_data(k1, k, 3);
  //     cmp_handle_data(v1, v, 3);
  //   }

  //   // no prefix
  //   {
  //     std::vector<Token> ids2 = random_ids(config.num_token_per_page, gen);
  //     auto h = kvc2->lookup(test_model_name, test_quant_type, ids2.data(), ids2.size(), ids2.size());
  //     assert(h->matched_length() == 0);
  //   }

  //   // insert partly new
  //   auto k2 = random_kvcache(10, gen);
  //   auto v2 = random_kvcache(10, gen);
  //   copy_kvcache(k1, k2, 0, 5);
  //   copy_kvcache(v1, v2, 0, 5);
  //   auto ids2 = random_ids(10 * config.num_token_per_page, gen);
  //   for (size_t i = 0; i < 5 * config.num_token_per_page; i++) {
  //     ids2[i] = ids1[i];
  //   }
  //   kvc2->raw_insert(test_model_name, test_quant_type, ids2.data(), ids2.size(), k2, v2);

  //   // read new part
  //   {
  //     std::vector<Token> ids(ids2.begin(), ids2.begin() + 7 * config.num_token_per_page);
  //     auto h = kvc2->lookup(test_model_name, test_quant_type, ids.data(), ids.size(), ids.size() + 7 *
  //     config.num_token_per_page); auto k = h->handle_data(true); auto v = h->handle_data(false); cmp_handle_data(k,
  //     k2, 7); cmp_handle_data(v, v2, 7);
  //   }
  kvc2->debug();

  SPDLOG_CRITICAL("All Test Passed: {}", argv[0]);
  return 0;
}