让不懂建站的用户快速建站,让会建站的提高建站效率!
栏目分类
发布日期:2024-12-19 21:30 点击次数:127
阿里巴巴通义践诺室语音团队晓谕,其开源的语音生成大模子CosyVoice已升级至2.0版块,这一升级象征着语音生成本事在准确性、放心性和当然体验方面的显赫朝上。CosyVoice2.0通过领受离线和流式一体化建模的语音生成大模子本事,杀青了双向流式语音合成,首包合成蔓延可达到150ms,显赫教训了语音合成的反馈速率。
在发音准确性方面,CosyVoice2.0比较于前一版块破绽率下落了30%至50%,在Seed-TTS测试集的hard测试集上获取了现时最低的字破绽率,尤其在合成急口令、多音字、荒僻字方面进展出色。此外,2.0版块在零样本语音生成和跨谈话语音合成上保抓了音色一致性,额外是跨谈话语音合成材干相较于1.0版块有了彰着教训。
CosyVoice2.0在合成音频的韵律、音质、热沈匹配方面也有所增强,MOS评测分从5.4教训至5.53,接近某生意化语音合成大模子的评分。同期,2.0版块复古更多细粒度的热沈规模和方言口音规模,为用户提供了更丰富的谈话领受,包括粤语、四川话、郑州话、天津话和长沙话等主要方言,以及扮装璜演功能,如师法机器东说念主、小猪佩奇的作风讲话等。
CosyVoice2.0的升级,不仅教训了语音合成的本事和体验,也进一步鼓舞了开源社区的发展,饱读动更多的成就者参与到语音贬责本事的翻新和行使中来。
GitHub仓库:CosyVoice(https://github.com/FunAudioLLM/CosyVoice)查阅最新更新的CosyVoice2在线体验DEMO:https://www.modelscope.cn/studios/iic/CosyVoice2-0.5B开源代码:https://github.com/FunAudioLLM/CosyVoice开源模子:https://www.modelscope.cn/models/iic/CosyVoice2-0.5B