"...unittest/git@developer.sourcefind.cn:OpenDAS/vision.git" did not exist on "f9af70a98244b30f645fb8a033b6e4ce59ca020f"
Commit fbbb1754 authored by lvzhen's avatar lvzhen
Browse files

Update README.md, 1.png files

parent 7aebfaac
Pipeline #1632 canceled with stages
......@@ -8,7 +8,7 @@
在这项工作中,作者提出了一种并行端到端 TTS 方法,它生成的音频比目前的两阶段模型更自然。该方法采用了变异推理,并增加了归一化流和对抗训练过程,从而提高了生成模型的表现力。作者还提出了一种随机时长预测器,可根据输入文本合成具有不同节奏的语音。通过对潜在变量的不确定性建模和随机时长预测器,该的方法表达了自然的一对多关系,即一个文本输入可以用不同的音调和节奏以多种方式说话。在 LJ Speech(一个单一说话者数据集)上进行的人类主观评估(平均意见分或 MOS)表明,该方法优于最佳的公开 TTS 系统,其 MOS 可与标准答案相媲美。
![image-20240829142644186](image-20240829142644186.png)
![原理](1.png)
## 环境配置
......@@ -98,4 +98,4 @@ rm -rf DUMMY1/*.pt
## 参考资料
https://github.com/jaywalnut310/vits/tree/main
\ No newline at end of file
https://github.com/jaywalnut310/vits/tree/main
Markdown is supported
0% or .
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment