# ASR ## 论文 无 ## 模型结构 ![image](https://developer.sourcefind.cn/codes/modelzoo/asr_onnx/-/raw/main/resources/silero_stt_model.jpg) ## 算法原理 ![image](https://developer.sourcefind.cn/codes/modelzoo/asr_onnx/-/raw/main/resources/asr.png) ## 数据集 无 ## 环境配置 在[光源](https://www.sourcefind.cn/#/service-details)可拉取推理的docker镜像,在[光合开发者社区](https://cancon.hpccube.com:65024/4/main/)可下载onnxruntime安装包。asr_onnx推荐的镜像如下: ``` docker pull image.sourcefind.cn:5000/dcu/admin/base/pytorch:2.1.0-ubuntu20.04-dtk24.04.1-py3.10 cd asr_onnxruntime #进入当前项目目录 docker run -d -t --privileged --device=/dev/kfd --device=/dev/dri/ --network=host --group-add video -v /opt/hyhal:/opt/hyhal:ro -v `pwd`:/mnt --name=asr-test image.sourcefind.cn:5000/dcu/admin/base/pytorch:2.1.0-ubuntu20.04-dtk24.04.1-py3.10 docker exec -it asr-test /bin/bash cd /mnt pip install onnx -i https://pypi.tuna.tsinghua.edu.cn/simple pip install pysoundfile -i https://pypi.tuna.tsinghua.edu.cn/simple ``` 下载模型 (https://models.silero.ai/models/en/en_v5.onnx) 到当前目录,建立wavs文件夹添加测试wav文件。 ## 推理 ``` python3 main.py --model_dir="./en_v5.onnx" --wav_dir="./wavs/" --warmup=1 # --wav_dir:需要推理的语音路劲,如"./speech_orig.wav";speech_orig.wav是文件夹中已经存在的语音 ``` ## result ![image](https://developer.sourcefind.cn/codes/modelzoo/asr_onnx/-/raw/main/resources/asr_result.png) ### 精度 暂无 ## 应用场景 ### 算法类别 语音识别 ### 热点应用行业 交通,金融,医疗,教育,家居 ## 源码仓库及问题反馈 https://developer.sourcefind.cn/codes/modelzoo/asr_onnx ## 参考资料 * [silero-models](https://github.com/snakers4/silero-models)