ElevenLabs发布了Eleven Multilingual v2:支持30种语言的AI语音模型
ElevenLabs发布了Eleven Multilingual v2:支持30种语言的AI语音模型' Condensed 'ElevenLabs发布了Eleven Multilingual v2:支持30种语言的AI语音模型
最近,ElevenLabs发布了一款名为Eleven Multilingual v2的多语言语音生成模型,可以在近30种语言中生成“情感丰富”的AI音频。这项工作将使制片人能够为欧洲、亚洲和中东市场本土化音频。
研究团队研究了18个月人类语音指标,并开发了检测上下文、表达情感和合成新的独特声音的新方法。该模型能够自动识别近30种书面语言,并在ElevenLabs的文本到语音平台中以前所未有的真实度生成声音。
克隆或合成的声音在所有语言中都保留了说话者声音的独特特征,例如他们的本地口音。现在可以使用相同的声音来为28种不同的语言制作动画。
此次发布是在该平台实现所有用户使用专业声音克隆之后。用户现在可以通过此更新制作与原始声音几乎无法区分的数字副本,同时还提供了更好的安全性和保护措施。除了现有的语言(英语、波兰语、德语、西班牙语、法语、意大利语、印地语和葡萄牙语),新模型还支持中文、韩语、荷兰语、土耳其语、瑞典语、印尼语、菲律宾语、日语、乌克兰语、希腊语、捷克语、芬兰语、罗马尼亚语、丹麦语、保加利亚语、马来语、斯洛伐克语、克罗地亚语、古典阿拉伯语和泰米尔语。
ElevenLabs验证了该平台在引入新功能和持续改进后今天退出了beta测试。这一变化标志着该公司致力于为其超过100万用户提供可靠和先进资源的里程碑。
ElevenLabs还正在研究一种方法,使用户能够与AI合作通过该平台创建新的音频。
通过在多种语言中添加文本到语音功能,该应用程序使视觉障碍人士或其他学习需求的人更容易获得视觉内容。以下是一些例子:
- 多语音生成工具为独立游戏开发者和发行商提供了新的可能性,可以将游戏体验和音频内容翻译成国际受众的语言,使他们能够与玩家和听众用他们的语言进行交流,而不会牺牲质量或准确性。
- 同样,学校现在可以提供学生及时访问高质量的母语者音频内容的资源,提高学生的听力和发音能力,并满足国际学生群体中的各种教学偏好。
通过降低以多种语言制作高质量音频所需的时间和费用,ElevenLabs帮助企业和创作者产生更多原创和易于理解的内容,以满足各种背景和语言的人们的需求。