Commit fbbb1754 authored by lvzhen's avatar lvzhen
Browse files

Update README.md, 1.png files

parent 7aebfaac
Pipeline #1632 canceled with stages
...@@ -8,7 +8,7 @@ ...@@ -8,7 +8,7 @@
在这项工作中,作者提出了一种并行端到端 TTS 方法,它生成的音频比目前的两阶段模型更自然。该方法采用了变异推理,并增加了归一化流和对抗训练过程,从而提高了生成模型的表现力。作者还提出了一种随机时长预测器,可根据输入文本合成具有不同节奏的语音。通过对潜在变量的不确定性建模和随机时长预测器,该的方法表达了自然的一对多关系,即一个文本输入可以用不同的音调和节奏以多种方式说话。在 LJ Speech(一个单一说话者数据集)上进行的人类主观评估(平均意见分或 MOS)表明,该方法优于最佳的公开 TTS 系统,其 MOS 可与标准答案相媲美。 在这项工作中,作者提出了一种并行端到端 TTS 方法,它生成的音频比目前的两阶段模型更自然。该方法采用了变异推理,并增加了归一化流和对抗训练过程,从而提高了生成模型的表现力。作者还提出了一种随机时长预测器,可根据输入文本合成具有不同节奏的语音。通过对潜在变量的不确定性建模和随机时长预测器,该的方法表达了自然的一对多关系,即一个文本输入可以用不同的音调和节奏以多种方式说话。在 LJ Speech(一个单一说话者数据集)上进行的人类主观评估(平均意见分或 MOS)表明,该方法优于最佳的公开 TTS 系统,其 MOS 可与标准答案相媲美。
![image-20240829142644186](image-20240829142644186.png) ![原理](1.png)
## 环境配置 ## 环境配置
...@@ -98,4 +98,4 @@ rm -rf DUMMY1/*.pt ...@@ -98,4 +98,4 @@ rm -rf DUMMY1/*.pt
## 参考资料 ## 参考资料
https://github.com/jaywalnut310/vits/tree/main https://github.com/jaywalnut310/vits/tree/main
\ No newline at end of file
Markdown is supported
0% or .
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment