首页 > 代码库 > (三)训练HMM模块

(三)训练HMM模块

“(二)杂项准备"之后,我们就已经训练了一个hmm模型了——“hmm0”。

接下来,我们将以“hmm0”作为基础,一路训练到“hmm7"。

 

1、从“hmm0"训练到"hmm3":

执行以下3条命令:

以hmm0为基础,生成hmm1
HERest -C ./config/config_color -I ./labels/phones_color.mlf -t 250.0 150.0 1000.0 -S ./config/train.scp -H ./hmm0/macros -H ./hmm0/hmmdefs -M ./hmm1/ ./lists/monoOffSP
以hmm1为基础,生成hmm2
HERest
-C ./config/config_color -I ./labels/phones_color.mlf -t 250.0 150.0 1000.0 -S ./config/train.scp -H ./hmm1/macros -H ./hmm1/hmmdefs -M ./hmm2/ ./lists/monoOffSP
以hmm2为基础,生成hmm3
HERest
-C ./config/config_color -I ./labels/phones_color.mlf -t 250.0 150.0 1000.0 -S ./config/train.scp -H ./hmm2/macros -H ./hmm2/hmmdefs -M ./hmm3/ ./lists/monoOffSP

以上命令完成之后,在hmm1、hmm2、hmm3目录下都会生成macros和hmmdefs

 

2、“特殊处理”hmm4,并生成hmm5:

(1)获得hmm4目录下hmmdefs文件:

perl ./scripts/fixSil hmm3/hmmdefs hmm4/hmmdefs

(2)复制hmm3目录下macros至hmm4目录下:

cp hmm3/macros ./hmm4/macros

(3)手动编辑sil.hed文件,并置于config目录下,sil.hed内容如下

AT 2 4 0.2 {sil.transP}  AT 4 2 0.2 {sil.transP}  AT 1 3 0.3 {sp.transP}  TI silst  {sil.state[3],sp.state[2]} 

(4)生成hmm5:

HHEd -H ./hmm4/macros -H ./hmm4/hmmdefs -M hmm5/ config/sil.hed ./lists/monophones

此时,hmm5目录下会生成hmmdefs和macros

 

3、从“hmm5“训练到"hmm7“:

以hmm5为基础,生成hmm6
HERest -C ./config/config_color -I ./labels/phones_color.mlf -t 250.0 150.0 1000.0 -S ./config/train.scp -H ./hmm5/macros -H ./hmm5/hmmdefs -M ./hmm6/ ./lists/monophones
以hmm6为基础,生成hmm7
HERest
-C ./config/config_color -I ./labels/phones_color.mlf -t 250.0 150.0 1000.0 -S ./config/train.scp -H ./hmm6/macros -H ./hmm6/hmmdefs -M ./hmm7/ ./lists/monophones

 注:以上命令执行过后可能会有类似:“WARNING [-2331]  UpdateModels: sp[8] copied: only 0 egs”这样的WANGING,可以暂且忽略。

 

训练到“hmm7”,hmm模型就已经能达到不错的识别效果了,理论上来说,训练得越多,识别就会越精确。

若要训练hmm8、hmm9等等,只要参照以上的“HERest“命令即可。

不过,我打算就到此为止了。

让我们看看成果吧!

 

HTK Book涉及内容:

Chapter 3: 3.2.2 Step 7 - Fixing the Silence Models

(三)训练HMM模块