首页 > 代码库 > shell脚本获取网页快照并生成缩略图

shell脚本获取网页快照并生成缩略图

获取网页快照并生成缩略图可分两步进行:

1、获取网页快照

2、生成缩略图

获取网页快照

这里我们用 phantomjs 来实现。关于 phantomjs 的详细用法可参考官方网站。

1、安装

我的环境是CentOS6.5,安装时直接下载 tarball 然后解压即可。

# wget https://bitbucket.org/ariya/phantomjs/downloads/phantomjs-1.9.8-linux-i686.tar.bz2# tar -jxvf phantomjs-1.9.8-linux-i686.tar.bz2# cp phantomjs-1.9.8-linux-i686/bin/phantomjs /bin/phantomjs

第二步中解压后bin目录下的 phantomjs 二进制文件即是可调用命令。

第三步是为了在以后调用命令时不必输入命令全路径。

2、调用

phantomjs的调用需要一个js脚本。这个js脚本接收两个参数,分别是网址url和快照文件名称filename,脚本snap.js内容如下:

/* * desc: get snapshot from url * author: 十年后的卢哥哥(http://www.cnblogs.com/lurenjiashuo/) * example: phantomjs snap.js http://www.baidu.com baidu.png */var page = require(‘webpage‘).create();var args = require(‘system‘).args;var pageW = 1024;var pageH = 768;page.viewportSize = {  width: pageW,  height: pageH};var url =  args[1];var filename = args[2];page.open(url, function (status) {    if (status !== ‘success‘) {        console.log(‘Unable to load ‘ + url + ‘ !‘);        phantom.exit();    } else {        window.setTimeout(function () {            page.clipRect = { left: 0, top: 0, width: pageW, height: pageH };            page.render(filename);            console.log(‘finish:‘, filename);            phantom.exit();        }, 1000);    }});

在这个脚本中还有个小小的设置,就是设置打开页面的浏览器可视区域的大小为1024*768,然后取第一屏内容。

调用命令如下:

phantomjs snap.js http://www.baidu.com baidu.png

注意:这里执行命令的用户需要对目录有写权限。

3、效果

获取的截图如下:

生成缩略图

生成缩略图用的是ImageMagick工具,ImageMagick是个非常强大的图片处理工具,可对图片进行转化(格式转换、缩放、剪切、模糊、反转等)、屏幕截图、图片显示等,详细用法可参考  我的ImageMagick使用心得 一文。

1、安装

redhat系列可使用yum安装:

# yum install ImageMagick ImageMagick-devel

其他平台安装请参考官方网站:http://www.imagemagick.org/script/binary-releases.php,根据你的系统选择相应的包或自己编译源码。

2、调用

我们这里只使用图片缩放工具,语法为:

convert -resize 320x240 baidu.png baidu_thumbnail.png

3、效果

生成的缩略图如下:

 

整合脚本

如果希望将上两步自动化,可以写一个shell脚本实现:

# !/bin/bash# desc: create snapshot from url# autor: 十年后的卢哥哥(http://www.cnblogs.com/lurenjiashuo/)# example: sh createsnap.sh http://www.baidu.com baiduURL=$1IMAGE_NAME=$2SNAPSHOT_NAME="${IMAGE_NAME}.png"THUMBNAIL_NAME="${IMAGE_NAME}_thumbnail.png"phantomjs snap.js $URL $SNAPSHOT_NAMEconvert -resize 320x240 $SNAPSHOT_NAME $THUMBNAIL_NAMEexit 0

参考文档

1、http://phantomjs.org/

2、http://www.imagemagick.org/

shell脚本获取网页快照并生成缩略图