Format code (#118)

4ea92f83 · Lianmin Zheng · GitHub · 6b0af285 · 4ea92f83 · 4ea92f83
Unverified Commit 4ea92f83 authored Jan 29, 2024 by Lianmin Zheng Committed by GitHub Jan 29, 2024
6 changed files
--- a/README.md
+++ b/README.md
@@ -324,7 +324,7 @@ python -m sglang.launch_server --model-path meta-llama/Llama-2-7b-chat-hf --port
 - Mixtral
 - LLaVA
  - `python3 -m sglang.launch_server --model-path liuhaotian/llava-v1.5-7b --tokenizer-path llava-hf/llava-1.5-7b-hf --port 30000`
- Qwen
+- Qwen / Qwen 2
 - AWQ quantization
 ## Benchmark And Performance

--- a/python/sglang/srt/models/llama2.py
+++ b/python/sglang/srt/models/llama2.py
@@ -319,4 +319,5 @@ class LlamaForCausalLM(nn.Module):
                weight_loader = getattr(param, "weight_loader", default_weight_loader)
                weight_loader(param, loaded_weight)
 EntryClass = LlamaForCausalLM
--- a/python/sglang/srt/models/llava.py
+++ b/python/sglang/srt/models/llava.py
@@ -331,4 +331,5 @@ def monkey_path_clip_vision_embed_forward():
        clip_vision_embed_forward,
    )
 EntryClass = LlavaLlamaForCausalLM
--- a/python/sglang/srt/models/mixtral.py
+++ b/python/sglang/srt/models/mixtral.py
@@ -377,4 +377,5 @@ class MixtralForCausalLM(nn.Module):
                weight_loader = getattr(param, "weight_loader", default_weight_loader)
                weight_loader(param, loaded_weight)
 EntryClass = MixtralForCausalLM
--- a/python/sglang/srt/models/qwen.py
+++ b/python/sglang/srt/models/qwen.py
@@ -259,4 +259,5 @@ class QWenLMHeadModel(nn.Module):
                weight_loader = getattr(param, "weight_loader", default_weight_loader)
                weight_loader(param, loaded_weight)
 EntryClass = QWenLMHeadModel
--- a/python/sglang/srt/models/qwen2.py
+++ b/python/sglang/srt/models/qwen2.py
@@ -315,4 +315,5 @@ class Qwen2ForCausalLM(nn.Module):
                weight_loader = getattr(param, "weight_loader", default_weight_loader)
                weight_loader(param, loaded_weight)
 EntryClass = Qwen2ForCausalLM