当前位置:搞趣网 >Meta 发布突破性生成式语音系统,一个通用模型解决多项任务

Meta 发布突破性生成式语音系统,一个通用模型解决多项任务

6月17日,Meta介绍了一种“突破性”的生成式语音系统,它可以合成六种语言的语音,执行噪声消除、内容编辑、转换音频风格等。

Meta称之为最通用的语音生成AI。Meta表示,Voicebox是第一个没有经过专门针对语音生成的训练,却可以泛化到语音生成任务的模型。与图像和文本的生成一样,Voicebox可以创建多种样式的语音输出,包括从头开始创建输出和修改给定的样本。Voicebox 可以合成六种语言的语音,以及执行噪声去除、内容编辑、风格转换和多样化样本生成。

Meta表示,Voicebox作为首个能成功执行任务泛化的高效的多功能模型,将开创一个语音生成式AI的新时代。

但Meta也没有否认这项技术可能被误用乃至被恶意使用。为了应对这种可能性,降低潜在的风险,Meta 还构建了一种分类器,其宣称可有效分辨真实语音和VoiceBox生成的音频。

【责任编辑:网络】

免责声明:本文图片引用自网络,如有侵权请联系我们予以删除

搞趣网发布此文仅为传递信息,不代表搞趣网认同其观点。