Update preprocess_data.py

edab45d4 · liangjing · 4b255099 · edab45d4
Commit edab45d4 authored Nov 12, 2024 by liangjing
Hide whitespace changes
Inline Side-by-side

Showing with 1 addition and 1 deletion

tools/preprocess_data.py tools/preprocess_data.py +1 -1

No files found.
--- a/tools/preprocess_data.py
+++ b/tools/preprocess_data.py
@@ -203,7 +203,7 @@ def get_args():
                       choices=['BertWordPieceLowerCase','BertWordPieceCase',
                                'GPT2BPETokenizer', 'SentencePieceTokenizer',
                                'GPTSentencePieceTokenizer', 'Llama2Tokenizer',
-                                'Llama3Tokenizer', 'MistralTokenizer', 'NullTokenizer'],
+                                'Llama3Tokenizer', 'MistralTokenizer', 'QwenTokenizer', 'NullTokenizer'],
                       help='What type of tokenizer to use.')
    group.add_argument('--tokenizer-model', type=str, default=None,
                       help='YTTM tokenizer model.')