Audiobox

Audiobox

Meta推出了免费开源语音生成模型Voicebox,基于Flow Matching技术,支持6种语言的文本转语音和语音编辑。该模型无需重新训练即可调整声音风格,还能执行噪音去除、内容编辑和跨语言风格转换等任务。相比VALL-E,Voicebox在质量和效率上提升显著,推理速度提高20倍,单词错误率降低50%。Meta强调语音生成技术需负责任使用,目前仅供研究目的,暂未开放模型和代码。
030