Commit 7f2c9096 authored by wangwei990215's avatar wangwei990215
Browse files

Update README.md

parent 9c99f75d
...@@ -112,13 +112,26 @@ python fairseq/train.py manifest/path --save-dir model-save/ --num-workers 6 --f ...@@ -112,13 +112,26 @@ python fairseq/train.py manifest/path --save-dir model-save/ --num-workers 6 --f
- --device-id:用于设置训练所需的卡的数量通过搭配HIP_VISIBLE_DEVICES实现单卡/多卡训练。<br> - --device-id:用于设置训练所需的卡的数量通过搭配HIP_VISIBLE_DEVICES实现单卡/多卡训练。<br>
- 若遇到 Error: argument --batch-size: invalid Optional value: ,则解决办法为直接到定义--batch-size和--max-tokens的地方,将其类型改为 int (原本为Optional[int],这个在较高的python版本上不支持),或者降低python版本。 - 若遇到 Error: argument --batch-size: invalid Optional value: ,则解决办法为直接到定义--batch-size和--max-tokens的地方,将其类型改为 int (原本为Optional[int],这个在较高的python版本上不支持),或者降低python版本。
### result
成功运行则会在终端输出类似如下信息。
![训练效果图](images/train_result.png)
## 推理 ## 推理
### 对语音文件进行特征提取 ### 对语音文件进行特征提取
``` ```
PYTHONPATH=/path/to/fairseq python examples/wav2vec/wav2vec_featurize.py --input /path/to/task/waves --output /path/to/output \ PYTHONPATH=/path/to/fairseq python examples/wav2vec/wav2vec_featurize.py --input path/to/task/waves --ext flac --output /path/to/output \
--model /model/path/checkpoint_best.pt --model /model/path/checkpoint_best.pt --split dir1 dir2
``` ```
Tips:<br>
- --split 参数设置的数量理论上无上限(dir1、dir2至dirn)。
- 上述参数的 --input 和 --split 的dir1、dir2等组合起来应该是.flac的语音文件所在文件夹。即.flac的语音文件位于path/to/task/waves/dir1中。
- 若是.wav文件则 --ext设置为 wav
### result ### result
程序成功运行则应在终端输出类似如下信息:
![推理效果](images/inference_result.png)
可从本项目的data文件夹下查看示例文件。 可从本项目的data文件夹下查看示例文件。
- 输入文件 ./datasets/LibriSpeech/dev-clean/84/121123/84-121123-0000.flac - 输入文件 ./datasets/LibriSpeech/dev-clean/84/121123/84-121123-0000.flac
- 输出 path/to/output/84-121123-0000.h5context - 输出 path/to/output/84-121123-0000.h5context
......
Markdown is supported
0% or .
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment