字节跳动发布中文歌声合成模型,可达人类歌唱水平的80%以上
近日,字节跳动人工智能实验室发表了一篇关于中文歌声合成系统的论文——《 A Chinese Singing Voice Synthesis System Using Duration Allocated Encoder-Decoder Acoustic Models and WaveRNN Vocoders》。论文中,研究者提出了一种基于持续时间分配的的类似Tacotron声学模型和WaveRNN神经网络声码器的中文歌声合成(SVS)系统——ByteSing。与传统的SVS模型不同,ByteSing采用类似Tacotron的编码器-解码器结构作为声学模型,分别以CBHG模型和递归神经网络(RNNs)作为编码器和解码器。
同时,利用辅助音素持续时间预测模型来扩展输入序列,可以增强模型的控制能力、稳定性和节奏预测精度。WaveRNN也被用作神经网络声码器,以进一步提高合成歌曲的音质。
研究表明,ByteSing能够达到人类歌唱水平的80%以上,这也是字节跳动研究者首次尝试的歌声合成任务。(钛媒体)

相关视频 更多
-
集体歌唱《我和我的祖国》
2019-09-20 19:37:38
-
用歌声献礼祖国|海南大学总裁班国庆献礼——《我和我的祖国》大合唱,由光度影视鼎力支持策划摄制
2019-09-30 17:01:28
-
杨元庆:2000美元以上的折叠屏手机太贵了,这钱够买好几个平板了
2019-04-10 18:49:39
-
戴建武:为什么人类的器官失去了再生能力?
2019-04-10 16:59:47
-
Plum红布林创始人CEO徐薇:布局精细化运营打造效益模型
2019-04-09 21:32:51
-
选手专访|张磊 波洛斯无人机最长续航时间可达80分钟
2020-09-11 19:11:20
-
人工智能技术发展到极致,会做伤害人类的事情吗?
2018-10-07 14:14:43
-
泡沫重现?美股超80%公司亏损上市,美国经济两年内衰退?
2019-04-10 04:40:47
-
海南省互联网招商宣传片 中文解说版
2019-09-25 14:54:44
-
海南省互联网招商宣传片 中文解说版
2020-12-18 15:42:31
相关资讯更多
-
谷歌AutoML系统自动开发出计算机视觉模型,性能已优于人类水平
2019-11-08 21:42:08
-
语音识别+歌声合成,思必驰的新产品想让普通人“读诗成曲”
2019-04-06 11:51:16
-
消息称字节跳动最早12月发布音乐流媒体服务,迎战苹果与Spotify
2019-11-18 15:34:13
-
字节跳动出海史,张一鸣如何在全球跳动字节?
2020-03-26 15:41:00
-
钟南山:中国新冠疫苗覆盖率2021年底可达80%
2021-05-29 15:14:07
-
人工智能预测流感发生,高发季预测准确率可达到90%以上
2019-04-04 01:22:20
-
最前线 | 字节跳动组织升级:张利东和张楠分别担任字节跳动(中国)董事长和CEO,张一鸣重抓海外
2020-03-12 20:07:21
-
氪星晚报 | 字节跳动称最快下半年发布新手机;网易游戏回应裁员;OPPO曝光瀑布屏无边框手机
2019-07-29 20:00:29
-
云天励飞陈宁:解决了视觉智能的问题,就解决了80%以上的问题
2019-04-03 23:39:19
-
想脱贫,先脱困:80%以上的焦虑,源于你对财富背后的力量一无所知
2019-07-12 16:00:10
-
80%甚至90%以上的战略研讨会,对企业没有实质性帮助
2021-01-28 16:30:12
-
最前线丨吉利要量产“N95 口罩”标准汽车,清洁程度可达手术室水平
2020-02-11 18:13:50
-
红点中国完成新一期4亿美元基金募集,80%以上的资金将用于布局A轮及早期项目
2019-01-23 16:59:24
-
华院首席科学家:中文或是人类面对人工智能的最后壁垒
2019-04-02 14:34:30
-
深圳公立医院出大招!80%以上民营医疗或将面临倒闭风险?
2019-10-30 10:10:08
-
【虎嗅晚报】字节跳动新增“字节锤子”商标;李国庆:后悔曾拒绝腾讯投资
2019-04-05 00:56:45
-
字节跳动的“围剿”与“反围剿”
2019-09-10 13:40:36
-
百度AI数字人度晓晓应战高考作文:40秒写40篇,水平超75%考生,文心大模型支持
2022-06-07 14:10:38
快报更多