Convert tokenizer outputs for Keras in doc example (#20732)

* Convert tokenizer outputs for Keras in doc example * Das deutsche Beispiel auch korrigieren

Convert tokenizer outputs for Keras in doc example (#20732)
* Convert tokenizer outputs for Keras in doc example * Das deutsche Beispiel auch korrigieren
c1b9a11d · Matt · GitHub · 0ba94ace · c1b9a11d · c1b9a11d
Unverified Commit c1b9a11d authored Dec 12, 2022 by Matt Committed by GitHub Dec 12, 2022
Hide whitespace changes
Inline Side-by-side

Showing with 4 additions and 0 deletions

docs/source/de/training.mdx docs/source/de/training.mdx +2 -0

docs/source/en/training.mdx docs/source/en/training.mdx +2 -0

No files found.
--- a/docs/source/de/training.mdx
+++ b/docs/source/de/training.mdx
@@ -185,6 +185,8 @@ from transformers import AutoTokenizer
 tokenizer = AutoTokenizer.from_pretrained("bert-base-cased")
 tokenized_data = tokenizer(dataset["text"], return_tensors="np", padding=True)
+# Tokenizer returns a BatchEncoding, but we convert that to a dict for Keras
+tokenized_data = dict(tokenized_data)
 labels = np.array(dataset["label"])  # Label is already an array of 0 and 1
 ```

--- a/docs/source/en/training.mdx
+++ b/docs/source/en/training.mdx
@@ -185,6 +185,8 @@ from transformers import AutoTokenizer
 tokenizer = AutoTokenizer.from_pretrained("bert-base-cased")
 tokenized_data = tokenizer(dataset["text"], return_tensors="np", padding=True)
+# Tokenizer returns a BatchEncoding, but we convert that to a dict for Keras
+tokenized_data = dict(tokenized_data)
 labels = np.array(dataset["label"])  # Label is already an array of 0 and 1
 ```