VALL-E是微软出品的语音神器
VALL-E一种用于文本到语音合成 (TTS) 的语言建模方法。VALL-E 出现了上下文学习能力,可用于合成高质量的个性化语音,只需录制 3 秒的未见过的说话者的注册录音作为声音提示。
产品说明