v1.0

0371621a · chenzk · 0371621a · 0371621a · 0371621a · 0371621a
Commit 0371621a authored Nov 27, 2024 by chenzk
12 changed files
--- a/scripts/import_hf_mistral_weights.py
+++ b/scripts/import_hf_mistral_weights.py
--- a/scripts/import_original_llama_weights.py
+++ b/scripts/import_original_llama_weights.py
--- a/scripts/prepare_datasets.py
+++ b/scripts/prepare_datasets.py
--- a/scripts/prepare_datasets.sh
+++ b/scripts/prepare_datasets.sh
+python prepare_datasets.py --index_file data/train_index.txt --input_data_dir data --data_split train --output_data_dir data --tiktoken_tokenizer_name "cl100k_base"
+# python prepare_datasets.py --index_file data/test_index.txt --input_data_dir data --data_split test --output_data_dir data --tiktoken_tokenizer_name "cl100k_base"
--- a/scripts/prepare_dpo_dataset.py
+++ b/scripts/prepare_dpo_dataset.py
--- a/scripts/prepare_sft_dataset.py
+++ b/scripts/prepare_sft_dataset.py
--- a/scripts/prune_model_layers.py
+++ b/scripts/prune_model_layers.py
--- a/setup.py
+++ b/setup.py
+from setuptools import setup
+
+setup(name='allamo',
+      version='5.0.0',
+      author='Krzysztof (Chris) Ociepa',
+      packages=['allamo'],
+      description='Simple, hackable and fast implementation for training/finetuning medium-sized LLaMA-based models',
+      license='MIT',
+      install_requires=[
+            'torch',
+            'numpy',
+            'joblib',
+            'wandb'
+      ],
+)
--- a/train.py
+++ b/train.py
+from allamo.configuration import AllamoConfiguration
+from allamo.trainer.simple_trainer import SimpleTrainer
+
+if __name__ == '__main__':
+    config = AllamoConfiguration()
+    trainer = SimpleTrainer(config)
+    trainer.init_wandb()
+    trainer.train()
+    trainer.close()
--- a/train.sh
+++ b/train.sh
+# Refer to allamo/configuration.py, if you need to sft:"training_type": "sft", "init_from": "resume", ...
+
+python train.py --config="./train_configs/train_1B.json"
--- a/train_configs/train_1B.json
+++ b/train_configs/train_1B.json
--- a/train_singelnode.sh
+++ b/train_singelnode.sh
+torchrun --standalone --nnodes=1 --nproc-per-node=8 train.py --config="./train_configs/train_1B.json"