科技魔方

支持1100种语言文本、语音互转,Meta推出开源AI项目MMS

AR/VR

2023年05月23日

  Meta 公司推出了 Massively Multilingual Speech(MMS)项目,为 1100 多种语言提供了先进的语言转文本、文本转语音服务,且支持将近 4000 多种未标记的口语。

Meta MMS AI语音

  Meta 为 MMS 项目整合了自我监督学习工作 wav2vec 2.0 和一个新的数据集,通过实测发现 MMS 优于现有模型,且支持的语言数量是其 10 倍。

  Meta 创造这项成就的关键在于引入了庞大的音频数据集,其中包含 1100 多种新约圣经(New Testament)的朗读内容。Meta 表示整合该音频数据集之后所产生的语音模型在男性和女性声音中表现同样出色。

+1

来源:IT之家

延展资讯