VISinger2

本仓库将VISinger2对接DiffSinger社区，兼容DiffSinger社区nomidi格式数据集、ds工程文件。相比于DiffSinger，本模型有着极快的合成速度，但不使用预训练模型情况下训练速度相对较慢，模型音质上限也低于DiffSinger

目前训练、推理代码还不是很易用，之后会逐步进行完善

数据集准备

先按照DiffSinger nomidi格式制作数据集，放入data目录下

高质量数据集制作可以参照DiffSinger数据集教程

data ├───speaker0 │ └───raw │ ├──wavs │ └──transcriptions.txt └───speaker1 └───raw ├──wavs └──transcriptions.txt

之后依次执行

# 调整文件夹结构 python prepare_multispeaker.py # 生成mel与pitch python preprocess.py # 生成多说话人配置 python preprocess_multispeaker.py # 之后将上一部生成的spk2id粘贴到配置文件egs/visinger2/config.json中

训练

cd egs/visinger2 bash bash/train.sh 0

推理

修改 ds_inference.py 中ds工程、说话人、模型路径

python ds_inference.py

Name		Name	Last commit message	Last commit date
Latest commit History 27 Commits
egs/visinger2		egs/visinger2
infer		infer
modules		modules
preprocess		preprocess
text/npu		text/npu
utils		utils
README.md		README.md
ds_inference.py		ds_inference.py
prepare_multispeaker.py		prepare_multispeaker.py
preprocess.py		preprocess.py
preprocess_multispeaker.py		preprocess_multispeaker.py
requirements_3090.txt		requirements_3090.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

VISinger2

数据集准备

训练

推理

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

VISinger2

数据集准备

训练

推理

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages