首页 > 代码库 > Linux下PHP自动生成文章预览图,html转换成各种格式图片、PDF-----转自phpboy的文章

Linux下PHP自动生成文章预览图,html转换成各种格式图片、PDF-----转自phpboy的文章

 

用WordPress建立博客站点,选择了一套可以显示文章缩略图的模板,几经折腾将原有模板改得面目全非,最后还是直接上线吧,不想折腾了。

站点上线没几天,在公司做项目时,对图片做了一个放大的JS,自己博客也加上点击缩略图查看原图的功能,然后迅速的加了。

过了几天,突发奇想,想做文章预览图,即点击缩略图查看文章预览图,也就是你们现在首页和文章列表页看到的那个功能。

不费话了,不知道什么时候又要折腾。。。

Linux下PHP自动生成文章预览图,最初大致的思路很简单,就是我能不能通过某种方式调用浏览器内核来渲染网页即HTML,然后将HTML保存为图片。然后开始一头扎进Google、Baidu,搜索了很长时间,得出结论,资料太少,想自己写一个C扩展,调用webkit内核。就在快要放弃的时候,在论坛里面看到wkhtmltox,然后所有的问题都在于wkhtmltox了,很庆幸的是在google code里面又看到了phpwkhtmltox,然后我笑了。

安装软件清单:

a.libwkhtmltox linux下的webkit内核(不依赖为图形界面)
b.phpwkhtmltox php扩展,可调用webkit内核将网页转换成各种格式图片或者pdf
c.font-chinese 中文字体
d.msyh,Consolas 字体

系统环境:Linux CentOS 6.2 64位

1.Linux下安装libwkhtmltox

libwkhtmltox是提取出来的可以直接复制到linux相应的目录的webkit内核,可能有人想着,要渲染网页是需要图形浏览器,但是我们的VPS一般都是没有图形界面的,其实我们只需要安装libwkhtmltox到linux即可,并不需要图形界面。

1.1.下载libwkhtmltox

下载地址:http://code.google.com/p/wkhtmltopdf/downloads/list?can=1&q=&colspec=Filename+Summary+Uploaded+ReleaseDate+Size+DownloadCount

需要说明的是,libwkhtmltox现在的版本已经是0.11了,但是本人在CentOS 6.2下安装了libwkhtmltox-0.11之后,在将网页转换成图片时会出错,最终选择了0.10版本,这个版本还是相当稳定的。

1.2.安装libwkhtmltox

下载并解压

1#mkdir libwkhtmltox
2#cd libwkhtmltox
3#wget http://wkhtmltopdf.googlecode.com/files/libwkhtmltox-0.10.0_rc2-amd64.tar.bz2
4#tar jxvf libwkhtmltox-0.10.0_rc2-amd64.tar.bz2
5#ll
6drwxr-xr-x 2 root root       59 Jan  3 20:58 examples
7drwxr-xr-x 3 1000 1000       22 Nov  7  2010 include
8drwxr-xr-x 2 1000 1000       28 Jan 31  2011 lib

安装

1#cd lib
2#cp libwkhtmltox.so /usr/local/lib/
3#cd ../include
4#cp -R wkhtmltox /usr/local/include/

1.3.安装phpwkhtmltox

下载并解压

1#wget https://github.com/mreiferson/php-wkhtmltox/archive/master.zip
2#unzip master.zip

作为php扩展安装

1#cd php-wkhtmltox-master
2#phpize
3#./configure
4#make install

修改PHP配置文件,追加

1extension=phpwkhtmltox.so

重新加载系统动态链接库(重要,否则PHP无法完成扩展phpwkhtmltox)

1#ldconfig

1.4.检查PHP是否已经支持phpwkhtmltox

1#php -m

如果输出的内容包括phpwkhtmltox说明扩展成功。

1.5.小试“牛刀”,将谷歌首页保存为图片

1.5.1.编辑测试的php脚本test_html_to_image.php

1<?php
2wkhtmltox_convert(
3    ‘image‘,
4    array(
5        ‘out‘ => ‘/tmp/test.jpg‘,
6        ‘in‘ => ‘http://www.google.com.hk/‘
7    )
8);
9?>

1.5.2.wkhtmltox_convert($type, $globalsetting, $objectsetting)说明

html转换为pdf示例:

1<?php
2wkhtmltox_convert(‘pdf‘,
3    array(
4        ‘out‘ => ‘/tmp/test.pdf‘,
5        ‘imageQuality‘ => ‘95‘
6    ), // global settings
7    array(
8        array(
9            ‘page‘ => ‘http://www.phpboy.net/‘
10        ),
11        array(
12            ‘page‘ => ‘http://www.baidu.com/‘
13        )
14    )// object settings
15);
16?>

具体其他参数请参考:http://www.cs.au.dk/~jakobt/libwkhtmltox_0.10.0_doc/pagesettings.html#pagePdfGlobal

1.5.2.运行PHP

1#php test_html_to_image.php

到tmp目录下就可以看到我们已经将google的首页保存为test.jpg图片,是不是很有成就感,把图片下载到本地,查看图片,你可能会发现中文显示为乱码,不用担心,请看下文。

1.6.让CentOS支持中文

1#yum groupinstall chinese-support

安装完毕之后,再次运行php test_html_to_image.php,中文就不会出现乱码了,但是你可能会觉得中文显示得不好看,不用担心,请看下文。

1.7.让linux CentOS支持微软雅黑字体

1.7.1.下载或者从本地windows拷贝微软雅黑(注意从windows系统里面拷贝出来应该是有2个文件),并上传到linux服务器

1.7.2.把字体文件拷贝到/usr/share/fonts/xxx,其中xxx为新增字体文件夹,如msyh

1#cd /usr/share/fonts/
2#mkdir msyh
3#cd msyh

1.7.3.建立字体缓存

1#mkfontscale
2#mkfontdir
3#fc-cache -fv

1.8.让Linux CentOS支持Consolas字体(技术类博客可能会发布一个示例代码,大部分wordpress技术博客都会安装SyntaxHighlighter插件,而该插件代码显示字体首选的是Consolas字体,所以为了html转换成图片时示例代码显示得好看,我们也需要让linux支持Consolas字体)

1.8.1下载或者从本地windows拷贝Consolas(注意从windows系统里面拷贝出来应该是有4个文件),并上传到linux服务器

1.8.2.把字体文件拷贝到/usr/share/fonts/xxx,其中xxx为新增字体文件夹,如Consolas

1#cd /usr/share/fonts/
2#mkdir Consolas
3#cd Consolas

1.8.3.建立字体缓存

1#mkfontscale
2#mkfontdir
3#fc-cache -fv

安装完毕之后,你可以再次运行php test_html_to_image.php,如果你填写的网址对应的网页采用微软雅黑字体,该网页转换成图片的显示效果就比较美观了。

最后,写了一个wordpress的插件,实现在保存文章时自动生成文章缩略图,有需要的同仁可以留言留下联系方式。

参考文档:
1.libwkhtmltox支持的参数说明http://www.cs.au.dk/~jakobt/libwkhtmltox_0.10.0_doc/pagesettings.html#pagePdfGlobal
2.自动生成网页截图(Screenshot)方法 http://www.phpip.com/design/skill/A62009909P/23444.html
3.CentOS 安装中文语言包以及输入法 http://blog.chinaunix.net/uid-24352482-id-3203655.html

Linux下PHP自动生成文章预览图,html转换成各种格式图片、PDF-----转自phpboy的文章