allow use custom local dataset for controlnet training scripts (#2928)

use custom local datset Co-authored-by: yiyixuxu <yixu310@gmail,com> Co-authored-by: Patrick von Platen <patrick.v.platen@gmail.com>

allow use custom local dataset for controlnet training scripts (#2928)
use custom local datset Co-authored-by: yiyixuxu <yixu310@gmail,com> Co-authored-by: Patrick von Platen <patrick.v.platen@gmail.com>
0c63c383 · YiYi Xu · GitHub · a87e88b7 · 0c63c383 · 0c63c383
Unverified Commit 0c63c383 authored Apr 04, 2023 by YiYi Xu Committed by GitHub Apr 04, 2023
Showing with 10 additions and 16 deletions

examples/controlnet/train_controlnet.py examples/controlnet/train_controlnet.py +5 -8

examples/controlnet/train_controlnet_flax.py examples/controlnet/train_controlnet_flax.py +5 -8

No files found.
--- a/examples/controlnet/train_controlnet.py
+++ b/examples/controlnet/train_controlnet.py
@@ -542,16 +542,13 @@ def make_train_dataset(args, tokenizer, accelerator):
            cache_dir=args.cache_dir,
        )
    else:
-        data_files = {}
        if args.train_data_dir is not None:
-            data_files["train"] = os.path.join(args.train_data_dir, "**")
+            dataset = load_dataset(
-        dataset = load_dataset(
+                args.train_data_dir,
-            "imagefolder",
+                cache_dir=args.cache_dir,
-            data_files=data_files,
+            )
-            cache_dir=args.cache_dir,
-        )
        # See more about loading custom images at
-        # https://huggingface.co/docs/datasets/v2.4.0/en/image_load#imagefolder
+        # https://huggingface.co/docs/datasets/v2.0.0/en/dataset_script
    # Preprocessing the datasets.
    # We need to tokenize inputs and targets.

--- a/examples/controlnet/train_controlnet_flax.py
+++ b/examples/controlnet/train_controlnet_flax.py
@@ -477,16 +477,13 @@ def make_train_dataset(args, tokenizer, batch_size=None):
            streaming=args.streaming,
        )
    else:
-        data_files = {}
        if args.train_data_dir is not None:
-            data_files["train"] = os.path.join(args.train_data_dir, "**")
+            dataset = load_dataset(
-        dataset = load_dataset(
+                args.train_data_dir,
-            "imagefolder",
+                cache_dir=args.cache_dir,
-            data_files=data_files,
+            )
-            cache_dir=args.cache_dir,
-        )
        # See more about loading custom images at
-        # https://huggingface.co/docs/datasets/v2.4.0/en/image_load#imagefolder
+        # https://huggingface.co/docs/datasets/v2.0.0/en/dataset_script
    # Preprocessing the datasets.
    # We need to tokenize inputs and targets.