首页 > 代码库 > Linux Tesseract-OCR安装与训练样本
Linux Tesseract-OCR安装与训练样本
安装对应的lib (install the libs)
参考:http://www.eefocus.com/winter1988/blog/13-03/292209_03d5b.html
sudo apt-get install autoconf automake libtool sudo apt-get install libpng12-dev sudo apt-get install libjpeg62-dev sudo apt-get install libtiff4-dev sudo apt-get install zlib1g-dev
确保安装下面的lib:
sudo apt-get install gcc sudo apt-get install g++ sudo apt-get install automake
安装Leptonica:
$wget http://leptonica.googlecode.com/files/leptonica-1.69.tar.gz
$tar zxvf leptonica-1.69.tar.gz
cd到其目录下:
./configure && make && sudo make install
安装 Tesseract:
$wget http://tesseract-ocr.googlecode.com/files/tesseract-ocr-3.02.02.tar.gz
$tar zxvf tesseract-ocr-3.02.02.tar.gz
cd到其目录下:
./configure && make && sudo make install
Install 后 需要 sudo ldconfig
使用训练包的话需要先安装英文包
设置 TESSDATA_PREFIX 语言包所在的目录(语言包在Win下训练好后直接导入tessdata目录下即可)
export TESSDATA_PREFIX=/usr/tesseract-ocr/
2.训练样本
参考:http://blog.csdn.net/yasi_xi/article/details/8763385
http://blog.csdn.net/marvinhong/article/details/8459591
需要注意的是最后五个包的重命名
声明:以上内容来自用户投稿及互联网公开渠道收集整理发布,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任,若内容有误或涉及侵权可进行投诉: 投诉/举报 工作人员会在5个工作日内联系你,一经查实,本站将立刻删除涉嫌侵权内容。