大小:960.00 MB
语言:简体中文系统:Android
类别:图形图像时间:2023-08-31
MoeTTS是一款相当优秀的Tacotron2/HifiGAN模型+编译好的GUI版本发布仓库,语音合成大部分角色效果非常好,后续还会发布至MoeTTS项目页。
MoeTTS是一款Tacotron2/HifiGAN模型+编译好的GUI版本发布仓库,训练时长3天,约900 Epoch,13人大型模型还在训练中,之后也会发布至MoeTTS项目页,视频后面的模型400 Epoch训练了5天,语音合成大部分角色效果很好了,数据较少的几个角色还不太行。
模型目录格式
单模型可以放在任意位置,如果模型带有配置文件,请将它重命名为config.json并与TTS模型放置在同一目录。(例如hifigan,vits模型,它们是带有配置文件的)
VITS模型请将config.json中的cleaners 改为custom_cleaners
文本输入格式
文本一般是输入音素(日语在这里应该输入罗马音),但具体要看模型训练者的数据是怎么输入的。比如我的ATRI模型(Tacotron2版本)是输入无空格罗马音,标点符号只支持逗号句号。
自定义Cleaner与Symbols
你可以在与moetts.exe同级的目录下找到custom文件夹,这里面存放了两种模型的文本模块。
自定义cleaner:找到cleaners.py并修改custom_cleaners函数即可(软件默认只会移除不在symbols中的字符,不对文本做进一步处理)
自定义symbols:找到symbols.py,将里面的符号为你需要的符号
注意:不同模型可能使用不同的cleaners与symbols训练,有需要请修改他们,保证模型能正常使用。
tacotron2
选择您的模型路径与输出目录,最后输入待合成文本,点击合成语音等待一会软件会将音频输出到输出目录/outpus.wav
注意事项:
首次合成需要加载模型,耗时较长,相同模型再次合成不会再次加载,直接合成。
如果切换模型,再次合成会重新加载。
如果修改cleaners与symbols,重新启动软件后才能生效。
软件为64位版本,不支持32位系统。
VITS特殊说明
VITS-Single,VITS-Multi分别为单角色模型与多角色模型
VITS-Multi中的原角色ID即待合成语音的角色ID,需要填入数字,目标角色ID为语音迁移功能的待迁移目标角色ID。
待迁移音频需要22050的采样率,16位,单声道。
视频录像精灵中文版媒体软件1.62 MB
下载ghost使用视频教程最新版教育教学10.50 MB
下载笔记本键盘加锁王应用软件901.00 MB
下载多国语言互译专家(语言互译软件)应用软件2.57 MB
下载ghost安装双系统工具系统工具1.95 MB
下载ghost系统恢复大师最新版系统工具8.86 MB
下载智能iis网站维护软件网络软件293.00 MB
下载窗口巡警(安全上网软件)网络软件388.00 MB
下载iis日志分析软件(水淼iis日志分析归类)网络软件2.00 MB
下载qq消息离线查看器联络聊天1.12 MB
下载相关文章
下载排行