[Bugfix]fix and needs_scalar_to_array logic check (#6238)

Co-authored-by: Robert Shaw <114415538+robertgshaw2-neuralmagic@users.noreply.github.com>

[Bugfix]fix and needs_scalar_to_array logic check (#6238)
Co-authored-by: Robert Shaw <114415538+robertgshaw2-neuralmagic@users.noreply.github.com>
d3a24513 · Baoyuan Qi · GitHub · 673dd4ca · d3a24513
Unverified Commit d3a24513 authored Jul 10, 2024 by Baoyuan Qi Committed by GitHub Jul 09, 2024
Show whitespace changes
Inline Side-by-side

Showing with 2 additions and 2 deletions

vllm/model_executor/layers/linear.py vllm/model_executor/layers/linear.py +2 -2

No files found.
--- a/vllm/model_executor/layers/linear.py
+++ b/vllm/model_executor/layers/linear.py
@@ -387,7 +387,7 @@ class MergedColumnParallelLinear(ColumnParallelLinear):
        if loaded_shard_id is None:
            # Loaded weight is already fused on disk (qkv/mlp).
            if output_dim is None:
-                if needs_scalar_to_array is not None:
+                if needs_scalar_to_array:
                    param_data, loaded_weight = adjust_scalar_to_fused_array(
                        param_data, loaded_weight, 0)
@@ -549,7 +549,7 @@ class QKVParallelLinear(ColumnParallelLinear):
        if loaded_shard_id is None:
            # Loaded weight is already fused on disk (qkv/mlp).
            if output_dim is None:
-                if needs_scalar_to_array is not None:
+                if needs_scalar_to_array:
                    param_data, loaded_weight = adjust_scalar_to_fused_array(
                        param_data, loaded_weight, 0)