Change the name to vLLM (#150)

0b98ba15 · Woosuk Kwon · GitHub · e5464ee4 · 0b98ba15 · 0b98ba15
Unverified Commit 0b98ba15 authored Jun 17, 2023 by Woosuk Kwon Committed by GitHub Jun 17, 2023
8 changed files
--- a/cacheflow/model_executor/weight_utils.py
+++ b/cacheflow/model_executor/weight_utils.py
--- a/cacheflow/outputs.py
+++ b/cacheflow/outputs.py
 from typing import Dict, List, Optional
-from cacheflow.sequence import SequenceGroup, SequenceStatus
+from vllm.sequence import SequenceGroup, SequenceStatus
 class CompletionOutput:

--- a/cacheflow/sampling_params.py
+++ b/cacheflow/sampling_params.py
--- a/cacheflow/sequence.py
+++ b/cacheflow/sequence.py
@@ -2,8 +2,8 @@ import copy
 import enum
 from typing import Dict, List, Optional, Union
-from cacheflow.block import LogicalTokenBlock
+from vllm.block import LogicalTokenBlock
-from cacheflow.sampling_params import SamplingParams
+from vllm.sampling_params import SamplingParams
 class SequenceStatus(enum.Enum):

--- a/cacheflow/utils.py
+++ b/cacheflow/utils.py
--- a/cacheflow/worker/__init__.py
+++ b/cacheflow/worker/__init__.py
--- a/cacheflow/worker/cache_engine.py
+++ b/cacheflow/worker/cache_engine.py
@@ -3,8 +3,8 @@ from typing import Dict, List, Tuple
 import torch
-from cacheflow import cache_ops
+from vllm import cache_ops
-from cacheflow.config import CacheConfig, ModelConfig, ParallelConfig
+from vllm.config import CacheConfig, ModelConfig, ParallelConfig
 KVCache = Tuple[torch.Tensor, torch.Tensor]

--- a/cacheflow/worker/worker.py
+++ b/cacheflow/worker/worker.py
@@ -3,16 +3,15 @@ from typing import Dict, List, Tuple
 import torch
-from cacheflow.config import (CacheConfig, ModelConfig, ParallelConfig,
+from vllm.config import (CacheConfig, ModelConfig, ParallelConfig,
-                              SchedulerConfig)
+                         SchedulerConfig)
-from cacheflow.model_executor import get_model, InputMetadata, set_random_seed
+from vllm.model_executor import get_model, InputMetadata, set_random_seed
-from cacheflow.model_executor.parallel_utils.parallel_state import (
+from vllm.model_executor.parallel_utils.parallel_state import (
    initialize_model_parallel, initialize_all_reduce_launcher)
-from cacheflow.sampling_params import SamplingParams
+from vllm.sampling_params import SamplingParams
-from cacheflow.sequence import (SequenceData, SequenceGroupMetadata,
+from vllm.sequence import SequenceData, SequenceGroupMetadata, SequenceOutputs
-                                SequenceOutputs)
+from vllm.worker.cache_engine import CacheEngine
-from cacheflow.worker.cache_engine import CacheEngine
+from vllm.utils import get_gpu_memory
-from cacheflow.utils import get_gpu_memory
 class Worker: