首页 > 代码库 > Moses创建一个翻译系统的基本过程记录,以后会按照每个过程详细说明,并给出每个步骤的参数说明
Moses创建一个翻译系统的基本过程记录,以后会按照每个过程详细说明,并给出每个步骤的参数说明
软件需求:
首先你必须要有Moses(废话哈哈)、然后要有GIZA++用作词对齐(traning-model.perl的时候会用到)、IRSTLM产生语言模型
大致步骤:
大体的步骤如下:
- 准备Parallerl data(需要句子对齐):对语料进行tokenisation、truecasing和cleaning步骤之后才能使用于我们的机器翻译系统(哈哈,都快忍不住直接写详细步骤了)
- 训练你的语言模型(使用IRSTLM):当然也有几步,详细叙述再说
- 然后就是训练你的翻译系统啦(可能要花一两个小时):(2) run GIZA
(3) align words
(4) learn lexical translation
(5) extract phrases
(6) score phrases
(7) learn reordering model
(8) learn generation model
(9) create decoder config file - 最后是蛋疼的Tuning(当然你也可以自己手动的Tuning),大概要花几个小时
- 最后你就可以跑了,如果你嫌启动慢,可以把模型转化为Binarised-model来进行,会更快,当然这会需要你改动一些东西,不过很简单
详细步骤以及说明:
Moses创建一个翻译系统的基本过程记录,以后会按照每个过程详细说明,并给出每个步骤的参数说明
声明:以上内容来自用户投稿及互联网公开渠道收集整理发布,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任,若内容有误或涉及侵权可进行投诉: 投诉/举报 工作人员会在5个工作日内联系你,一经查实,本站将立刻删除涉嫌侵权内容。