首页 > 代码库 > 文通文档影像分类器

文通文档影像分类器

 

需求背景:

档案管理在各行业都是一项重要的工作,随着时间的推移,各种纸质档案资料越来越多,档案资料的归档、保存、查阅工作也越来越困难,各行业在档案管理、档案再利用上投入的成本越来越多。随着IT技术的发展,档案影像(电子)化管理被越来越多的用户所接受,通过构建档案影像(电子)化管理系统,用户可以达到以下目标:

  • 档案影像化后,原始档案即可封包存储,通过对图像建立索引,即可实现档案的电子化调阅和电子化管理;
  • 档案电子化后可长期存储,原始档案在留存法定时间后即可销毁,节省了存储、保管、运输等费用;
  • 档案电子化提高了档案调阅的效率,从而提高了工作效率,降低了人工成本;

 

目前,在档案电子化过程中,无法做到档案影像的自动分类和管理,即计算机无法自动判断一张图像究竟是发票、订单还是快递单,影像分类归档是借助手工分类和业务流程控制完成的,自动化程度低,亟需提高分类的效率。文通文档影像分类器应用而生。


产品概述 :

文通文档影像分类器是可实现影像的自动分类,其不仅可以完成金融风险监督系统中多种票据的自动分类,并且可以实现其它表单表格、档案影像的自动分类,如可智能区分不同快递公司的快递单、发票、凭证等等。分类器由两部份组成:模板编辑器和自动分类核心。其中模板编辑器完成模板的定制工作,并由分类模板指导分类器进行影像分类。

  
产品功能:

1、图像预处理:去黑边、去装订孔、倾斜校正等等;
2、分类模板编辑工具:脚本编辑工具;
3、分类器引擎:影像自动分类,归档输出;


产品特点:

1、模板分类精细、准确率高
模板分类的准确率达到99%以上;分类器同时支持

  • 表格框线(位置、颜色)分类;
  • 标题单元(标题内容、标题颜色)分类;
  • 文本区域(文本内容、文本颜色)分类;
  • 图像特征抽取分类;

分类器以最大限度发掘不同凭证之间的差异。如框线颜色、标题颜色均可以用来区分多联凭证的不同联;文本内容可以区分同一凭证打印多种交易的影像;文本颜色可以用来区分同一种凭证分多联并且不同联之间框线颜色和标题颜色均相同的影像。

2、分类速度快
经过实际生产线运行计算,单张凭证分类时间为100ms~200ms。


我们的服务:
  • 结合您的业务场景,推荐优秀的影像采集、分类和管理方案;
  • 集成开发技术支持,在企事业客户开发应用系统的过程中,我们全程跟踪,为客户方提供专业团队的技术服务;
  • 为客户提供持续的软件升级服务;

应用领域/方案:
  • 快递单分拣

文通文档影像分类器