首页 > 代码库 > APache PDFbox API使用(2)----命令行工具的使用

APache PDFbox API使用(2)----命令行工具的使用

在写具体代码之前,咱们先了解一下Apache PDFbox API框架给我们提供的命令行工具。通过这个命令行工具,我们可以了解大部分

Apache PDFbox给我们提供的强大功能。


在我们运行命令之前,我们首先需要去下载这个命令行工具所依赖的jar文件,大家可以去下面的任何一个站点去下载。


http://apache.fayea.com/apache-mirror/pdfbox/1.8.5/pdfbox-app-1.8.5.jar 
http://mirrors.cnnic.cn/apache/pdfbox/1.8.5/pdfbox-app-1.8.5.jar 
http://apache.dataguru.cn/pdfbox/1.8.5/pdfbox-app-1.8.5.jar 
http://mirrors.hust.edu.cn/apache/pdfbox/1.8.5/pdfbox-app-1.8.5.jar 
http://mirror.bit.edu.cn/apache/pdfbox/1.8.5/pdfbox-app-1.8.5.jar 

http://mirror.esocc.com/apache/pdfbox/1.8.5/pdfbox-app-1.8.5.jar 


下载完成后,大家可以把这个jar放到本地电脑上的一个文件中,笔者就把其放在,d:/pdftest 目录下,

假设大家有一件配置好Java home的环境了。我们本人配置的是,jdk1.6.0; 你可以根据你实际的安装环境,

使用其他JDK的版本。




环境都准备好了,现在万事具备,只欠实际操作。但是在实际操作之前,给大家简单啰嗦一下,Apache

PDFBox项目到底自带了那些命令来操作PDF文件的呢?总的来说,其包括了下面的一些命令。

  • PDFBox命令行工具
    • Decrypt:  解密一个PDF文档
    • Encrypt:  加密一个PDF文档
    • ExtractText:从PDF文档中提取字符串
    • OverlayPDF: 覆盖PDF文件
    • PrintPDF : 打印PDF文件
    • PDFDebugger: 列出PDF文档本身的信息
    • PDFReader : 读取PDF文档
    • PDFMerger: 合并PDF文档
    • PDFSplit : 拆分PDF文档
    • PDFToImage: 把PDF文档转换成一张图片
    • TextToPDF: 把一段文本转换成一个PDF文件
    • WriteDecodedDoc: 解压缩一个PDF文件

限于篇幅,我们当前的例子中。只演示3~4个命令的使用,其他的大家可以参考https://pdfbox.apache.org/commandline/ 其
官方网站上说明或者读者自己举一反三。

(1) 在进行所有的命令前,我肯定需要一个PDF的文件,那么我们就用这个工具来创建一个PDF文件: TextToPDF
我们在网上找一篇文章。我们就以https://pdfbox.apache.org/architecture.html这篇文章为例子,把其拷贝到一个test.txt文件
中,并把这个文本文件放在d:/pdftest 文件夹下。然后执行下面的命令。

d:\pdftest>java -jar d:/pdftest/pdfbox-app-1.8.5.jar TextToPDF d:/pdftest/csdnblog.pdf d:/pdftest/test.txt
将会在d:\pdftest 文件中产生一个test.pdf文件。这个PDF文件包含2页纸。



(2) 既然我们已经创建好了,那么我们就用命令行工具:PDFReader 查看一下,

D:\pdftest>java -jar d:/pdftest/pdfbox-app-1.8.5.jar PDFReader d:/pdftest/test.pdf



(3) 在上面我提到了,生成的test.pdf 有两页。现在我们就用PDFSplit命令把test.pdf拆成两个PDF文件。

d:\pdftest>java -jar d:/pdftest/pdfbox-app-1.8.5.jar PDFSplit -startPage 1 -split 1  d:/pdftest/test.pdf

其中 -startPage 1 表示从第一页开始拆分

        -split 1 表示被拆分后,每个单独的被拆分的PDF文件是多少页

下图是拆分后的结果,可以看出test.pdf 被拆分成了2个PDF文件,test-0.pdf和test-1.pdf



(4)最后给大家展示一下PDFDebugger命令行工具的使用。

D:\pdftest>java -jar d:/pdftest/pdfbox-app-1.8.5.jar PDFDebugger d:/pdftest/test.pdf
执行上面的命令后,将会弹出下面的窗体。其显示了PDF文件本身的一些描述信息。