首页 > 代码库 > PDF表格到Excel格式的转换系统-RainbowPDF2.0

PDF表格到Excel格式的转换系统-RainbowPDF2.0

证券公司处理上市公司PDF会计报表的有力工具
 
            高精度将PDF表格到Excel格式的转换系统
   解决证券公司统计上市公司的会计报表时,PDF报表的数据输入问题!
    目前上市公司的会计报表全部以PDF格式上报到交易所,并且为了安全,实施了加密、禁止修改、禁止打印、禁止文字抽取等各种保护措施,给证券公司带来了很大困难,统计上市公司的数据只好重新把数据用手工方式输入一遍。
    北京红樱枫软件有限公司的RainbowPDF软件解决了您的大麻烦,利用它可以毫不费劲的把PDF中的表格数据自动转换到Excel中。而且表格、文字可以自动识别,分开存放。有了他,省时、省力、准确。下面是转换效果图:

 
    PDF格式成了网络时代文件格式的主流,特点在于PDF可以不受语言和计算机环境的限制, PDF档案可允许设定密码和其他多种保护方式,当今公司通用PDF格式保存文件资料。作为证券公司需对目标公司的会计报表数据,偿债能力,经营效率,盈利能力,成长能力,现金流量比率及重要项目进行分析,但PDF文件格式不能编辑、复制多种保护下要获取数据进行分析给工作带来了不便。对此红樱枫公司开发两种软件将PDF转换为Excel文件格式,解决了PDF不能编辑、复制等问题,为证券公司提供技术上的方便。HYFsoft开发了两款PDF表格转换软件,一款为rainbowserver V1.0转换软件;另一款为PDF Excel Text转换软件。下面对两款软件分别进行简单介绍:
 
Rainbowserver V2.0介绍
一. 系统概述
    Rainbowserver V1.0采用命令行方式将PDF转化为Excel格式。除了转换PDF中的表格,还可以将文本、图像和表格外的各种格式转换到Excel,通过这种转换可以再次应用PDF中不同类型的表格。
二. 系统功能简介
1. 轻松编辑Excel中的文本
    RainbowServer V1.0获取PDF中描述的文本数据,并将其转换为Excel格式。在转换使用过程中不会产生乱码,克服了以往对PDF加密文件内容无法操作的缺陷,能自由编辑Excel中的文本。
2. 在Excel中从容计算
    RainbowServer V1.0识别数据并将其转换成Excel中的数字格式,方便的在Excel中能对其进行计算。解决了人为把数字输入电脑再进行计算操作的麻烦。

3. 原样保持文本的字体、样式、颜色和大小。
    PDF中文本的字体、样式、颜色和大小等都可以转换成Excel,并保持原样
 
4. 支持转换的格式
    RainbowServer V1.0支持以下文件格式。
源文件格式:  Adobe PDF  1.3-1.7(扩展名为 .pdf)
             * 由Acrobat8保存的PDF Package只能转换第一页。
目标文件格式:microsoft  Excel 97-2003 ( BIF8 )
* Excel 2007 XML ( XLSX)不支持。

三.操作功能简介:
    本系统操作非常的方便,系统进行批量转换,由一个文本数据转换结束后自动接着下一个文本数据的转换。如下图所示:

 
1.转换后的文件名与PDF源文件同名
2.对于转到excel中的表格内容,标题列对齐方式,标题行,标题行和列以外的内容对齐方式都可以通过需求设定
3.文本数据转换后得到的表格中单元格之间的相对位置应与PDF中基本一致,保存在Sheet中,即保持PDF中原有的页数,不会有遗漏的问题的出现

四.系统性能
    本系统的开发成功,实现了PDF与Excel自动转换,减少人为数据处理的错误,提高工作效率和质量。能够对目标公司财务报表将文本、图像和表格外的各种格式进行自由转换,并保持其原有质量。
    按照公司软件产品质量管理体系的要求,进行了各方面的测试。
1.功能测试:检测各项功能能否正常运行,转换结果的准确性。
2.速度测试:转换效率的评测
3.压力测试:检查批量处理时程序的运行状态,并对数据进行重复连续测试
4.内存泄漏测试:对系统申请的内存在功能执行完毕后是否全部释放。
 
PDFtoExcelV1.2介绍
一.PDF Excel Text概述:
    本应用软件是由北京红樱枫软件有限公司研制开发。本软件可以将PDF文件中的表格部分抽取到excel文件中,文本部分抽取到文本文件中,然后将抽取得到的excel文件和文本文件转换成文本文件。也可以直接将PDF文件转换成文本文件。

二.系统功能简介
1.数据转换功能:
(1)PDF格式的数字文件与Excel数据格式的转换
(2)EXCEL表中的数据进行加工处理,取出需要的内容生成新的EXCEL文件和其他文件
2.图形数据的转换以及识别功能:
    实现了包括有表格线和无线表格的转换。

三.系统操作功能简介
    本系统转换功能强大,操作简单易学,主操作界面转换功能一目了然。在左侧工具菜单中选择所要使用的功能。如图所示:

 
2.PDF抽出文本及Excel,由文本和Excel转换为文本,批量的选择PDF文件转换,显示表示转换进度的进度提示信息(进度条),进度信息内容包括总的PDF文件数,当前正在转换的文件及其进度,总进度以进条显示。

 
1.PDF转Excel是指将PDF文件中所有表格全部抽取到excel中,每个表格一个Sheet,对于有线表格每个Sheet名按“LT 1”, “LT2”…顺序命名。对于无线表格,每个Sheet名按“T1”,“T2”…顺序命名。 

 
3.从PDF中抽取的表格与PDF原文基本保持表格形式的一致,表格中单元格之间的相对位置与PDF中一致。
4.在转换过程中, PDF中跨页的表格在抽取时基本完成作为同一张表格处理
5.本软件的运行要求