首页 > 代码库 > 1、Java截取网页形成图片
1、Java截取网页形成图片
1、闲扯
有一个GUI编程的开源框架叫SWT(Standard Widget Toolkit),它与sun公司的AWT、Swing类似。非界面编程人员,这里就不扯它们的优缺点了。
或许很多人都没听说过SWT,但是如果说出由它制作出来的一个工具,大家可能会对它肃然起敬。这个工具就是IBM开发的Eclipse。于是我们如果要给Eclipse开发插件,那么就得对SWT非常了解了。
2、要求
要截取网页形成图片,需要1-2要求。这里的1是要配置java.libarary.path;2是需要两个jar包。
1要求:配置java.library.path。
也许大家都知道配置环境变量path。然而这个环境变量和这个java.library.path有什么作用呢?
path:指定的是classpath,也就是通过这个变量可以找到相应的Java类;而有时候,Java可能需要利用到本地的代码库文件(在Windows上为dll文件,在Linux上为so文件)。系统如何找到这个动态链接库呢?当然也需要一个变量指向,这个变量就是java.library.path。
2需求:拿到两个jar包。
一个jar包是Eclipse当中的。打开Eclipse的安装目录,我的目录为“E:\eclipse\plugins”,在这个下面会有一个org.eclipse.swt.win32.x86_64_***.jar的包。
另一个包就是基于这个Eclipse的包开发的进行实际应用(如:截取网页形成图片、渲染成Html文件)的jar包。这个jar包具体是谁开发的就不知道了。它的项目点击可下载。
3、部署
将两个包加到自己的项目当中。另外,在另外一个地方将Eclipse里面拿出的那个jar进行解压,可以看到里面有三个dll的动态链接库文件。我们将这三个文件拷贝到某个目录下。我的目录为“D:/swt”。 然后,在开发运行的时候可以配置一下虚拟机的参数,方法为:右键点击项目——>Run as——>Run Configurations。如下进行配置,这样就使得java.library.path指向了程序运行过程中所需要的几个动态链接库。要不然会抛出:java.lang.UnsatisfiedLinkError no *****.dll in java.library.path,如此的异常。到这里,我们就可以进行测试了。看看它惊奇的效果。
4、分析
我们在学习GUI编程的时候,都知道,先要进行视图的布局。这里的视图就是一个个的面板。设置面板的样式、大小。面板上面叠加面板做出超炫的样式,或者在面板上添加监听事件与用户进行交互。
这里进行截取网页也是如此。网页怎么被渲染出来的?网页的样式布局是被浏览器根据脚本渲染出来的效果,这里我们就利用了浏览器这个“面板”。在浏览器的下面还有一个面板“shell”。这也是说,shell面板上有一个browser的面板,我们传一个URL给browser面板后,面板能对其返回的页面进行渲染。这里我们执行browser面板的大小就为一帧,现在我们只关心它的高度,这个高度是可以由我们指定的(当然需要修改其源代码),默认为500。我们通过在java代码当中执行javascript脚本,就能返回这时候网页内容的总高度。这个总高度/500+1就是我们需要将这个网页刷屏几次才能得到一个完整的网页。项目的核心方法如下(默认的要刷好几次屏才能将网页捕获完整;我将其改成刷一次屏就能捕获完整的网页,但是要将其线程睡眠时间弄长点,要不然网页还没渲染出来,就已经捕获完了,那么形成的图片的数据就会有所残缺):
1 final int perHight=2027; 2 public void render(final File saveLocation) throws RenderingException 3 { 4 final File localSaveLocation = new File(saveLocation.getParentFile().getAbsolutePath() + File.separator + "localhost"); 5 localSaveLocation.mkdirs(); 6 System.out.println("Saving temporary images in directory :" + localSaveLocation.getAbsolutePath()); 7 8 String widthStr = null; 9 //根据javascript脚本得到网页内容的宽度和高度10 widthStr = this.getJavascriptValue("document.body.scrollWidth+‘-‘+document.body.scrollHeight");11 if (widthStr == null)12 throw new RenderingException("Could not acquire Document height andf width by javascript.");13 14 final int width = SCREEN_WIDTH;15 //如果网页内容高度大于10000那么就取值10000,否则就是内容高度本身16 int nonFinalHeight = Math.min(10000, Integer.parseInt(widthStr.split("-")[1]));17 18 //perHight就是每一帧刷多高,如果网页内容高度小于一帧的取值高度就取值一帧的高度;否则,就取值内容的高度19 final int height = nonFinalHeight < perHight ? perHight: nonFinalHeight;20 21 System.out.println("Screen sizes :" + width + " ," + height);22 23 int start=0;24 25 //然后将作为内容高度的height变量除以一帧高度,也就是要对这个网页进行刷屏多少次。26 //我们也就要将网页内容进行移动,移动网页内容,只要移动浏览器Y轴上的滚动条就行,27 //初始状态,不需要滚动,也就是当i=0时。当i=1时,就需要滚动一帧的内容,因为每次滚动,滚动条初始在0位置,因此每次start都是从0开始。28 29 30 for (int i = 0; i < 1 + (height / perHight); i++)31 {32 if (i != 0)33 {34 this.execute("window.scrollTo("+start+"," + i * (perHight - scrollbarY) + ");");35 try36 {37 Thread.sleep(10000);//这个时间稍微长点,要不页面还没有刷出来就已经捕获了这一帧38 }39 catch (InterruptedException e)40 {41 throw new RenderingException(e);42 }43 }44 final int j = i;45 //下面的异步方法就是捕获一帧的网页46 //这里呈现的屏幕的高度和宽度是固定的,只是在这个固定的区域当中,内容在变而已。47 //因此,我们只要对这一块固定的区域进行捕获就可以了。48 display.syncExec(new Runnable()49 {50 public void run()51 {52 if (j == 0 || j < (height / perHight))53 capture(localSaveLocation.getAbsolutePath(), j, SCREEN_WIDTH,perHight, 0, 0);54 else55 capture(localSaveLocation.getAbsolutePath(), j, SCREEN_WIDTH, (height % perHight == 0 ? perHight : height % perHight), 0, perHight - (height % perHight));56 }57 });58 }59 display.syncExec(new Runnable()60 {61 public void run()62 {63 try64 {65 final Image result = new Image(display, width, height);66 GC gc = new GC(result);67 for (int i = 0; i < (1 + height / perHight); i++)68 {69 70 ImageLoader imageLoader = new ImageLoader();71 File partialImageFile = new File(localSaveLocation, "savedImage" + i + ".jpg");72 FileInputStream fis = new FileInputStream(partialImageFile);73 Image loadedImage = new Image(display, imageLoader.load(fis)[0]);74 gc.drawImage(loadedImage, 0, i * (perHight - scrollbarY));75 loadedImage.dispose();76 fis.close();77 // Delete the partial image file once we are done with78 // it :79 partialImageFile.delete();80 }81 gc.dispose();82 ImageLoader imageSaver = new ImageLoader();83 imageSaver.data = http://www.mamicode.com/new ImageData[] { result.getImageData() };84 System.out.println("Saving image to location :" + saveLocation);85 FileOutputStream fos = new FileOutputStream(saveLocation);86 imageSaver.save(fos, SWT.IMAGE_JPEG);87 fos.close();88 result.dispose();89 90 }91 catch (Exception e)92 {93 e.printStackTrace();94 }95 }96 });97 98 }
1、Java截取网页形成图片