README.md 1.85 KB
Newer Older
SWHL's avatar
SWHL committed
1
2
3
4
5
6
7
8
9
10
11
## Rapid paraformer
- 模型出自阿里达摩院[Paraformer语音识别-中文-通用-16k-离线-large-pytorch](https://www.modelscope.cn/models/damo/speech_paraformer-large_asr_nat-zh-cn-16k-common-vocab8404-pytorch/summary)
- 本分支对模型做了转换,仅采用ONNXRuntime推理引擎


#### 使用步骤
1. 安装环境
   ```bash
    pip install -r requirements.txt
   ```
2. 下载模型
SWHL's avatar
SWHL committed
12
   - 由于模型太大(881M),上传到仓库不容易下载,提供百度云下载连接:[asr_paraformerv2.onnx](https://pan.baidu.com/s/1-nEf2eUpkzlcRqiYEwub2A?pwd=dcr3)
SWHL's avatar
SWHL committed
13
14
15
16
17
18
19
20
21
22
23
24
25
   - 模型下载之后,放在`rapid_paraformer/models`目录下即可,最终目录结构如下:
        ```text
        rapid_paraformer
        ├── config.yaml
        ├── __init__.py
        ├── kaldifeat
        │   ├── feature.py
        │   ├── __init__.py
        │   ├── ivector.py
        │   ├── LICENSE
        │   └── README.md
        ├── models
        │   ├── am.mvn
SWHL's avatar
SWHL committed
26
        │   ├── asr_paraformerv2.onnx  # 放在这里
SWHL's avatar
SWHL committed
27
28
29
30
31
32
        │   └── token_list.pkl
        ├── rapid_paraformer.py
        └── utils.py
        ```

3. 运行demo
SWHL's avatar
SWHL committed
33
34
35
36
37
38
39
40
41
42
    ```python
    from rapid_paraformer import RapidParaformer

    paraformer = RapidParaformer()

    wav_path = 'test_wavs/example_test.wav'
    print(wav_path)
    result = paraformer(str(wav_path))
    print(result)
    ```
SWHL's avatar
SWHL committed
43
44
45
46
47
4. 查看结果
   ```text
   [['呃说不配合就不配合的好以上的话呢我们摘取八九十三条因为这三条的话呢比较典型啊一些数字比较明确尤其是时间那么我们要投资者就是了解这一点啊不要轻信这个市场可以快速回来啊这些配市公司啊后期又利好了可
   以快速快速攻能包括像前一段时间啊有些媒体在二三月份的时候']]
   ```