首页 > 代码库 > Wavenet运行

Wavenet运行

作者:桂。

时间:2017-05-10  19:17:32

链接:http://www.cnblogs.com/xingshansi/p/6832219.html 

技术分享


一、环境

  • python3.5
  • Win8.1,64位

二、Wavenet安装

Wavenet安装环境:

  • Tensorflow:1.0.1以上版本,查看自己的版本:

技术分享

  • librosa工具包:用来读写audio文件,之前已经安装;

有了上面的条件,

  • 在Github上下载Wavenet工具包,关于Wavenet工具包,也有学者提出了Fast wavenet
  • 用于Wavenet训练的语料库CSTR VCTK Corpus 

 将tensorflow-wavenet文件夹放在:\Anaconda3\Lib\文件夹下,cd到对应路径并运行:

pip install -r requirements.txt

  安装tensorflow-wavenet完毕:

技术分享

下载VCTK数据库,并解压:

技术分享

python切换到指定路径下,输入:

python train.py --help

  可以查看函数具体用法:

技术分享

VCTK/wav48/中不同文件夹的音频信息:

技术分享

将VCTK/wav48/的部分音频复制,形成一个用于训练的wav文件夹:

技术分享

并修改train.py对应指令:

技术分享

运行train.py报错:

技术分享

 stackoverflow给出了解答:

技术分享

按照这个说法,新建logdir:

技术分享

并修改train.py的代码:

 技术分享

训练过程中有许多warning的提示,意思是音频基本都是寂静音,因此进行忽略:

技术分享

原程序中:SILENCE_THRESHOLD = 0.3,这里参考stackoverflow的说法:

技术分享

将SILENCE_THRESHOLD设定为0.1,可以看到虽然还有部分是warninig,但已经可以training了:

技术分享

 同样,generate.py的路径也修改一下:

技术分享

generate.py的结果有点像噪声,可能操作有问题,记录在此:

技术分享

打算后面学习Wavenet,Wavenet的更多内容参考Github.

涉及到的概念较多,后面打算学习一些Tensorflow的知识并系统学习深度神经网络的相关知识。

Wavenet运行