IT之家 5月23日消息,Meta公司推出了Massively Multilingual Speech(MMS)项目,为1100多种语言提供了先进的语言转文本、文本转语音服务,且支持将近4000多种未标记的口语。
Meta为MMS项目整合了自我监督学习工作wav2vec 2.0和一个新的数据集,通过实测发现MMS优于现有模型,且支持的语言数量是其10倍。
Meta创造这项成就的关键在于引入了庞大的音频数据集,其中包含1100多种新约圣经(New Testament)的朗读内容。Meta表示整合该音频数据集之后所产生的语音模型在男性和女性声音中表现同样出色。