OCR 项目记录

首页 > 代码库 > OCR 项目记录

2024-09-18 02:12:52 219人阅读

应用场景：

用户在朋友圈中会上传许多图片，而我们希望从用户上传的这些图片中识别出那些关于证件的照片（比如：身份证，驾驶证，护照等），因为这些证件的照片会含有一些个人敏感信息。我们希望通过OCR识别出照片中的文字，然后判断这些文字中有没有诸如：passport，name，nationality等字段来判断这张图片是不是一张证件相关的照片，为此我们会维护一个关键字的wordlist。

问题解决：

首先要进行OCR，我们选择了tesseract。tesseract是一个开源的OCR引擎，最初有HP开发，后来贡献给开源社区，现由谷歌维护。tesseract识别能力和一些付费OCR软件相比还是差一些，但是对于这个项目也差不多够用了。

OCR 项目记录

声明：以上内容来自用户投稿及互联网公开渠道收集整理发布，本网站不拥有所有权，未作人工编辑处理，也不承担相关法律责任，若内容有误或涉及侵权可进行投诉：投诉/举报工作人员会在5个工作日内联系你，一经查实，本站将立刻删除涉嫌侵权内容。

联系
我们

首页 > 代码库 > OCR 项目记录

OCR 项目记录

看完仍有疑问？有类似问题直接问程序猿