Fix typo in config: train.gpu -> train.gpu_mem

c2407dec · Tri Dao · 13cdceb3 · c2407dec · c2407dec · c2407dec
Commit c2407dec authored Dec 21, 2022 by Tri Dao
4 changed files
--- a/training/configs/experiment/pile/gpt3-2.7B-flash-hdim128-rotary-8k.yaml
+++ b/training/configs/experiment/pile/gpt3-2.7B-flash-hdim128-rotary-8k.yaml
@@ -11,7 +11,7 @@ model:
    mlp_checkpoint_lvl: 0

 datamodule:
-  batch_size: ${eval:"1 if ${train.gpu_mem} < 24 else (2 if ${train.gpu_mem} < 40 else (4 if ${train.gpu} < 80 else 8))"}
+  batch_size: ${eval:"1 if ${train.gpu_mem} < 24 else (2 if ${train.gpu_mem} < 40 else (4 if ${train.gpu_mem} < 80 else 8))"}

 train:
  optimizer:

--- a/training/configs/experiment/pile/gpt3-2.7B-flash-hdim128-rotary.yaml
+++ b/training/configs/experiment/pile/gpt3-2.7B-flash-hdim128-rotary.yaml
@@ -11,7 +11,7 @@ model:
    mlp_checkpoint_lvl: 0

 datamodule:
-  batch_size: ${eval:"4 if ${train.gpu_mem} < 24 else (8 if ${train.gpu_mem} < 40 else (16 if ${train.gpu} < 80 else 32))"}
+  batch_size: ${eval:"4 if ${train.gpu_mem} < 24 else (8 if ${train.gpu_mem} < 40 else (16 if ${train.gpu_mem} < 80 else 32))"}

 train:
  optimizer:

--- a/training/configs/experiment/pile/gpt3-2.7B-flash-rotary-8k.yaml
+++ b/training/configs/experiment/pile/gpt3-2.7B-flash-rotary-8k.yaml
@@ -11,7 +11,7 @@ model:
    mlp_checkpoint_lvl: 0

 datamodule:
-  batch_size: ${eval:"1 if ${train.gpu_mem} < 24 else (2 if ${train.gpu_mem} < 40 else (4 if ${train.gpu} < 80 else 8))"}
+  batch_size: ${eval:"1 if ${train.gpu_mem} < 24 else (2 if ${train.gpu_mem} < 40 else (4 if ${train.gpu_mem} < 80 else 8))"}

 train:
  optimizer:

--- a/training/configs/experiment/pile/gpt3-2.7B-flash-rotary.yaml
+++ b/training/configs/experiment/pile/gpt3-2.7B-flash-rotary.yaml
@@ -11,7 +11,7 @@ model:
    mlp_checkpoint_lvl: 0

 datamodule:
-  batch_size: ${eval:"4 if ${train.gpu_mem} < 24 else (8 if ${train.gpu_mem} < 40 else (16 if ${train.gpu} < 80 else 32))"}
+  batch_size: ${eval:"4 if ${train.gpu_mem} < 24 else (8 if ${train.gpu_mem} < 40 else (16 if ${train.gpu_mem} < 80 else 32))"}

 train:
  optimizer: