Update Python_intro.md

b7947c85 · Guolin Ke · GitHub · b1e34d15 · b7947c85
Commit b7947c85 authored Dec 15, 2016 by Guolin Ke Committed by GitHub Dec 15, 2016
Show whitespace changes
Inline Side-by-side

Showing with 14 additions and 2 deletions

docs/Python_intro.md docs/Python_intro.md +14 -2

No files found.
--- a/docs/Python_intro.md
+++ b/docs/Python_intro.md
@@ -30,9 +30,9 @@ The data is stored in a ```Dataset``` object.
 #### To load a libsvm text file or a LightGBM binary file into ```Dataset```:
 ```python
-train_data = lgb.Dataset('train.svm')
+train_data = lgb.Dataset('train.svm.bin')
-test_data = lgb.Dataset('test.svm.bin')
 ```
 ####  To load a numpy array into ```Dataset```:
 ```python
 data = np.random.rand(500,10) # 500 entities, each contains 10 features
@@ -49,6 +49,18 @@ train_data = lgb.Dataset(csr)
 train_data = lgb.Dataset('train.svm.txt')
 train_data.save_binary("train.bin")
 ```
+#### Create validation data
+```python
+test_data = train_data.create_valid('test.svm')
+```
+or 
+```python
+test_data = lgb.Dataset('test.svm', reference=train_data)
+```
+In LightGBM, the validation data should be aligned with training data.
 #### Specific feature names and categorical features