"vscode:/vscode.git/clone" did not exist on "8da05b386da4648beef35d319ba2eed6f8a9659f"
Commit db9efc4e authored by dcuai's avatar dcuai
Browse files

Update README.md

parent 028637f8
...@@ -66,7 +66,7 @@ bash install_ctc_decoders.sh ...@@ -66,7 +66,7 @@ bash install_ctc_decoders.sh
- 官方下载链接: - 官方下载链接:
- [LibriSpeech_asr数据集官方下载](https://www.openslr.org/12) - [LibriSpeech_asr数据集官方下载](https://www.openslr.org/12)
librisspeech是大约1000小时的16kHz英语阅读演讲语料库,数据来源于LibriVox项目的有声读物,并经过仔细分割和整理,其中的音频文件以flac格式存储,语音对应的文本转炉内容以txt格式存储。<br> librispeech是大约1000小时的16kHz英语阅读演讲语料库,数据来源于LibriVox项目的有声读物,并经过仔细分割和整理,其中的音频文件以flac格式存储,语音对应的文本转炉内容以txt格式存储。<br>
数据集的目录结构如下: 数据集的目录结构如下:
``` ```
...@@ -89,7 +89,7 @@ LibriSpeech ...@@ -89,7 +89,7 @@ LibriSpeech
├── test-clean ├── test-clean
└── test-othe └── test-othe
``` ```
在'data'文件夹下放了一个来自于librispeech的小数据集用于测试。 *在'data'文件夹下放了一个来自于librispeech的小数据集用于快速测试。
### 创建Manifest文件 ### 创建Manifest文件
在训练之前,需要通过一下命令创建和数据集对应的Manifest文件,该文件包括数据集的文件路径和语音的转录文本 在训练之前,需要通过一下命令创建和数据集对应的Manifest文件,该文件包括数据集的文件路径和语音的转录文本
```sh ```sh
......
Markdown is supported
0% or .
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment