首页 > 代码库 > python用Tesseract读取图片中的中文,出现乱码

python用Tesseract读取图片中的中文,出现乱码

  • 到http://download.csdn.net/detail/wanghui2008123/7621567下载中文简体包
  • 然后找到tessdata目录,把eng.traineddata替换为chi_sim.traineddata,并且把chi_sim.traineddata重命名为eng.traineddata
  • ok,现在中文识别基本达到90%以上了

本文参考:http://www.aichengxu.com/view/9506028

python用Tesseract读取图片中的中文,出现乱码