谷歌翻译是该公司最常用的产品之一。它可以帮助人们从输入文本,拍摄图片和使用语音到文本技术将一种语言翻译成另一种语言。现在,Google推出了一个名为Translatotron的新项目,该项目将提供语音到语音的直接转换。
在Google的AI博客上的一篇文章中,该工具背后的团队解释说,它不是使用语音到文本,文本到语音来转换,而是依赖于一个新的模型(在神经网络上运行)来开发新系统。
Translatotron这个系统避免了将任务分成不同的阶段,提供了一些优于级联系统的优势,包括更快的推理速度,自然地避免了识别和翻译之间的复合错误,使翻译后保留原始发言人的声音变得简单, 谷歌研究小组在博客文章中写道,Translatotron还能更好地处理不需要翻译的单词(例如姓名和专有名词)。
当从一种语言翻译成另一种语言时,Translatotron还可以保留说话者的声音特征。这对于配音电视和电视节目的声音编辑非常有用。
考虑到这仍然是一个模型,谷歌可能需要一段时间才能在消费级解决方案中实施新系统