P-Flow是通过语音提示实现快...
P-Flow是通过语音提示实现快速、数据高效的零样本 TTS的模型。通过使用连续语音提示的训练方法,P-Flow 以少两个数量级的训练数据匹配大规模零样本 TTS 模型的说话者相似度性能,并且采样速度快了 20 倍以上。
EmotiVoice 是一款功能强大且...
基于 EnCodec 标记器的非官方...
该存储库包含用于训练 Pheme ...
Tortoise 是一个文本转语音程...
XTTS 是一种语音生成模型,让...
它是一个用于教学、培训和使...