Update README.md

7f2c9096 · wangwei990215 · 9c99f75d · 7f2c9096
Commit 7f2c9096 authored Nov 25, 2024 by wangwei990215
Hide whitespace changes
Inline Side-by-side

Showing with 15 additions and 2 deletions

README.md README.md +15 -2

No files found.
--- a/README.md
+++ b/README.md
@@ -112,13 +112,26 @@ python fairseq/train.py manifest/path --save-dir model-save/ --num-workers 6 --f
 - --device-id：用于设置训练所需的卡的数量通过搭配HIP_VISIBLE_DEVICES实现单卡/多卡训练。<br>
 - 若遇到  Error： argument --batch-size: invalid Optional value: ，则解决办法为直接到定义--batch-size和--max-tokens的地方，将其类型改为 int （原本为Optional[int]，这个在较高的python版本上不支持），或者降低python版本。
+### result
+成功运行则会在终端输出类似如下信息。
+![训练效果图](images/train_result.png)
 ## 推理
 ### 对语音文件进行特征提取
 ```
-PYTHONPATH=/path/to/fairseq python examples/wav2vec/wav2vec_featurize.py --input /path/to/task/waves --output /path/to/output \
+PYTHONPATH=/path/to/fairseq python examples/wav2vec/wav2vec_featurize.py --input path/to/task/waves --ext flac --output /path/to/output \
--model /model/path/checkpoint_best.pt
+--model /model/path/checkpoint_best.pt --split dir1 dir2 
 ```
+Tips：<br>
+- --split 参数设置的数量理论上无上限(dir1、dir2至dirn)。
+- 上述参数的 --input 和 --split 的dir1、dir2等组合起来应该是.flac的语音文件所在文件夹。即.flac的语音文件位于path/to/task/waves/dir1中。
+- 若是.wav文件则 --ext设置为 wav
 ### result
+程序成功运行则应在终端输出类似如下信息：
+![推理效果](images/inference_result.png)
 可从本项目的data文件夹下查看示例文件。
 - 输入文件 ./datasets/LibriSpeech/dev-clean/84/121123/84-121123-0000.flac
 - 输出 path/to/output/84-121123-0000.h5context