Skip to content

innnky/VISinger2-nomidi

 
 

Repository files navigation

VISinger2

本仓库将VISinger2对接DiffSinger社区,兼容DiffSinger社区nomidi格式数据集、ds工程文件。相比于DiffSinger,本模型有着极快的合成速度,但不使用预训练模型情况下训练速度相对较慢,模型音质上限也低于DiffSinger

目前训练、推理代码还不是很易用,之后会逐步进行完善

数据集准备

先按照DiffSinger nomidi格式制作数据集,放入data目录下

data ├───speaker0 │ └───raw │ ├──wavs │ └──transcriptions.txt └───speaker1 └───raw ├──wavs └──transcriptions.txt

之后依次执行

# 调整文件夹结构 python prepare_multispeaker.py # 生成mel与pitch python preprocess.py # 生成多说话人配置 python preprocess_multispeaker.py # 之后将上一部生成的spk2id粘贴到配置文件egs/visinger2/config.json中

训练

cd egs/visinger2 bash bash/train.sh 0

推理

修改 ds_inference.py 中ds工程、说话人、模型路径

python ds_inference.py

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors

Languages

  • Python 99.9%
  • Shell 0.1%