fifteenai15 于日前通过其网站 15.ai 发布了最新的深度学习 TTS (文字转语音)工具。据介绍,这一工具通过多种音频合成算法和经过定制的神经网络,并且能依靠很少的数据就能可信的模仿角色的声音。目前,网站提供来自《小马宝莉》、《传送门》、 《军团要塞》,《女神异闻录4》,《神秘博士》 以及《半衰期》等作品在内的各类 ACG 角色(其中以《小马宝莉》居多),效果如下:
值得注意的是, 15.ai 通过 DeepMoji (该情感分析模型“对12亿条带有表情符号的推文进行了训练,以了解如何使用语言表达情感)推论出整个文本的感知情感。得益于此,本算法可以用极低成本就能准确复制数百个人物的声音,同时还能保留十分可信的语音情感和自然度,也让15.ai 成为目前最优异的 TTS 算法之一。
作者同时也强调,本项目是麻省理工学院本科生研究机会计划(UROP) 的一部分,算法也没有用于任何现实世界人物。在使用网站前,所有读者朋友需注意网站内容仅限非商业用途且必须注明 15.ai 链接。网站使用的所有代码和模型均为私有,不得出售、分发以及未授权使用。
评论区
共 49 条评论热门最新