Commit 6e3b8948 authored by wangwei990215's avatar wangwei990215
Browse files

Update README.md

parent bc892135
# wav2vec_pytorch # wav2vec
## 论文 ## 论文
wav2vec: Unsupervised Pre-training for Speech Recognition wav2vec: Unsupervised Pre-training for Speech Recognition
- https://arxiv.org/abs/1904.05862 - https://arxiv.org/abs/1904.05862
...@@ -118,7 +118,7 @@ python fairseq/train.py manifest/path --save-dir model-save/ --num-workers 6 --f ...@@ -118,7 +118,7 @@ python fairseq/train.py manifest/path --save-dir model-save/ --num-workers 6 --f
## 推理 ## 推理
### 对语音文件进行特征提取 ### 对语音文件进行特征提取
首先安装h5py用于读取模型文件 首先安装h5py用于读取模型文件
``` ```
pip install h5py pip install h5py
``` ```
...@@ -132,15 +132,15 @@ Tips:<br> ...@@ -132,15 +132,15 @@ Tips:<br>
- 上述参数的 --input 和 --split 的dir1、dir2等组合起来应该是.flac的语音文件所在文件夹。即.flac的语音文件位于path/to/task/waves/dir1中。 - 上述参数的 --input 和 --split 的dir1、dir2等组合起来应该是.flac的语音文件所在文件夹。即.flac的语音文件位于path/to/task/waves/dir1中。
- 若是.wav文件则 --ext设置为 wav - 若是.wav文件则 --ext设置为 wav
### result:
### result
程序成功运行则应在终端输出类似如下信息: 程序成功运行则应在终端输出类似如下信息:
![推理效果](images/inference_result.png) ![推理效果](images/inference_result.png)
可从本项目的data文件夹下查看示例文件。 可从本项目的data文件夹下查看示例文件。
- 输入文件 ./datasets/LibriSpeech/dev-clean/84/121123/84-121123-0000.flac - 输入文件 ./datasets/LibriSpeech/dev-clean/84/121123/84-121123-0000.flac
- 输出 path/to/output/84-121123-0000.h5context - 输出 path/to/output/84-121123-0000.h5context
### 精度
## 应用场景 ## 应用场景
### 算法分类 ### 算法分类
......
Markdown is supported
0% or .
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment