Learn more about Speech Recognition

语音合成:进化、伦理与法律

Roman Garin,Sportradar的高级副总裁@创新本文追溯了语音合成的演变,并探讨了其广泛的法律影响

用于恶意内容检测的LLMs:优点与缺点

这篇文章评估了两种不同的方法来识别互联网上的有害内容:训练监督分类器和使用大型语言模型

“Meta推出‘SeamlessM4T’ AI模型,能够实时翻译多达100种语言”

在通往全球交流的革命性举措中,科技巨头Meta推出了最新的AI模型,命名为SeamlessM4T。这款全能多语言多模式的翻译和转录模型...

在Mozilla Common Voice上的语音识别——音频转换

这是基于Mozilla Common Voice数据集的语音语言识别的第三篇文章在第一部分中,我们讨论了数据选择和数据预处理,在第二部分...

Mozilla Common Voice上的口语识别——第一部分

“识别说话者的语言以便进行后续的语音转文本转换是最具挑战性的人工智能任务之一这个问题可能出现在许多情况下,例如当人们生...

介绍AudioPaLM:谷歌在语言模型方面的突破

在生成式人工智能领域的一项重大发展中,科技巨头谷歌推出了AudioPaLM,一款先进的多模态语言模型。这个开创性的模型结合了谷...