S

speech_fsmn_vad_zh-cn-16k-common-pytorch_transformers

FSMN-Monophone VAD用于检测输入音频中有效语音的起止时间点信息,并将检测出来的有效音频片段输入识别引擎进行识别,减少无效语音带来的识别错误。