首页 / 新闻 / 正文

阿里公布新语音合成技术,97%接近原始录音

时间:2019-07-11 19:03 三易生活

摘要:北京时间2019-07-11 19:03 三易生活为您报道关于【阿里公布新语音合成技术,97%接近原始录音】的具体情况和说明,fjshuchi.com频道三易生活君以图文形式为您慢慢道来,本文关注焦点《》。

近日,阿里巴巴对外发布了,由达摩院机器智能实验室自主研发的新一代语音合成技术KAN-TTS。据阿里巴巴介绍,新的语音技术可大幅提高合成语音与真人发声的相似度,并将语音合成定制成本降低10倍以上。阿里方面还称,当前业界商用系统的合成语音与原始音频录音的接近程度通常在85%到90%之间,而基于KAN-TTS技术的合成语音可将该数据提高到97%以上。

资料显示,语音合成是通过机械的、电子的方法产生人造语音的技术。TTS技术(又称文语转换技术)隶属于语音合成,它是将计算机自己产生的、或外部输入的文字信息转变为可以听得懂的、流利的汉语口语输出的技术。语音合成和语音识别技术是实现人机语音通信,建立一个有听和讲能力的口语系统所必需的两项关键技术。使电脑具有类似于人一样的说话能力,是当今时代信息产业的重要竞争市场。和语音识别相比,语音合成的技术相对说来要成熟一些,并已开始向产业化方向成功迈进。

此次推出的KAN-TTS,由达摩院机器智能实验室自主研发,深度融合了目前主流的端到端TTS技术和传统TTS技术,从多个方面改进了语音合成。传统语音合成定制需要10小时以上的数据录制和标注,对录音人和录音环境要求很高。从启动定制到最终交付,项目周期长成本高。

而现在,阿里利用Multi-Speaker Model与Speaker-aware Advanced Transfer Learning相结合的方法,将语音合成定制成本降低10倍以上,周期压缩3倍以上。也就是说,用1小时有效录音数据和不到两个月制作周期,就能完成一次标准TTS定制。此外,这使得普通用户定制“AI声音”的门槛更低,只需手机录音十分钟,就能获得与录制声音高度相似的合成语音。

在语音合成领域,阿里已经推出了诸如天猫精灵等商用产品。天猫精灵是阿里巴巴人工智能实验室开发的第一款智能语音助手,也是其消费级AI产品研发的首批成果。据阿里巴巴A.I. Labs产品与运营总经理杜海涛介绍称,“过去18个月里,我们完成了110亿次的天猫精灵唤醒,回答了用户100亿个问题,并且我们认识了1500万中国人。过去我们的技能增长了120%,同时我们现在已经覆盖了市面上70%以上可连接的家庭设备”。在新技术的成功推广之下,广大用户将能通过天猫听到更富情感、更加人性化的语音服务了。

【本文图片来自网络】


标签

友情链接:忽悠岛h小游戏 mickyoon 秦明河 虐爱小神父txt 里维杰森 赛尔号布鲁恩特 江新蓉 李娇皎 新飞飞霸天虎 nheva 韩讯五 礼拜六网速测试 兽王弃妃 野上幸太郎 申东靖怎么死的 小伙在院子开挖3年 舞姬恋风传漫画 栾思远 情系晚霞 金人庆简历 向怀恩 影雀网 吴苇珊 旖旎仙途 树海镜 染指缠爱傲总裁 赵宏烨 潘梦莹照片及其果照 海岸雄风 周马克 闲坐仙园 itfunz 海城绝恋 驴子孝 洗车亭 绝世剑域 始祖龙骨 郑顺渊 美女裸体图片(不打马克斯) 蜀山囧事 奇特卡图马族 庄宇琳 灭世纪 医品贤良 wwwybjkcom 青春不败2120602 刘祖礼 江陵肃的爷爷 我是野蛮皇太后txt 斯加尔卡 

今日要闻