首页 > 代码库 > Apache日志优化

Apache日志优化

apache运行时会记录其处理的所有请求的相关信息.同时,也会记录在处理过程中发生异常状况的相关信息.
服务器可以用多种格式将与请求相关的活动信息记录在多个日志文件中,不过却只能记录一份错误信息.
关于活动记录,它是在请求完成被处理后才会对日志内容进行写入.如一个大文件的上传,它是在文件上传完后才写入日志的.而错误信息是在错误发生时就写入.当然,错误的发生也是一瞬间的事.不会出现请求那种长时间处理.
有一种通用的显示日志的方式:CLF(common log format).格式是:
"%h %l %u %t \"%r\" %>s %b"
但随着发展,这种格式的内容不够多,人们又组织了另一种格式:
"%h %l %u %t \"%r\" %>s %b \"%{Referer}i\" \"%{User-agent}i\""
它能记住请求的浏览器版本及其他客户端软件的名称与版本等.
Apache自带有一个标准的日志模块:mod_log_config.另外,Apache 2.0还带有一个额外的模块:mod_logio.它是前者的加强版.而且在http://modules.apache.org的模块注册区还有其它的第三方模块可供使用.
例如,我的Apache的httpd.conf文件中有如下配置:
ErrorLog "logs/error.log"
LogLevel warn
<IfModule log_config_module>
    LogFormat "%h %l %u %t \"%r\" %>s %b \"%{Referer}i\" \"%{User-Agent}i\"" combined
    LogFormat "%h %l %u %t \"%r\" %>s %b" common
    <IfModule logio_module>
      LogFormat "%h %l %u %t \"%r\" %>s %b \"%{Referer}i\" \"%{User-Agent}i\" %I %O" combinedio
    </IfModule>
    CustomLog "logs/access.log" common
</IfModule>
在我的Apache安装目录下的logs目录下有两个文件,就是上面配置的error.log和access.log
上面的配置先定义了Apache错误信息的日志输出.并定义了日志输出的等级.等级有如下几种:
 等级名称介绍 
emerg 紧急状况;服务器无法使用 
alert 必须立刻采取动作 
 crit危急状况 
 error出现错误 
 warn警告 
 notice正常,但有情况要注意 
 info普通信息 
 debug调试级别信息,包括模块运行状态
设定一个等级后,日志文件中会记录它,以及它以上等级的日志.但不管设定为可值,永远都会记录notice等级的信息.

日志中格式字符串:
格式字符串描述
%%百分号(Apache2.0.44或更高的版本)
%a远端IP地址
%A本机IP地址
%B除HTTP头以外传送的字节数
%b以CLF格式显示的除HTTP头以外传送的字节数,也就是当没有字节传送时显示‘-‘而不是0。
%{Foobar}C在请求中传送给服务端的cookieFoobar的内容。
%D服务器处理本请求所用时间,以微为单位。
%{FOOBAR}e环境变量FOOBAR的值
%f文件名
%h远端主机
%H请求使用的协议
%{Foobar}i发送到服务器的请求头Foobar:的内容。
%l远端登录名(由identd而来,如果支持的话),除非IdentityCheck设为"On",否则将得到一个"-"。
%m请求的方法
%{Foobar}n来自另一个模块的注解Foobar的内容。
%{Foobar}o应答头Foobar:的内容。
%p服务器服务于该请求的标准端口。
%P为本请求提供服务的子进程的PID。
%{format}P服务于该请求的PID或TID(线程ID),format的取值范围为:pidtid(2.0.46及以后版本)以及hextid(需要APR1.2.0及以上版本)
%q查询字符串(若存在则由一个"?"引导,否则返回空串)
%r请求的第一行
%s状态。对于内部重定向的请求,这个状态指的是原始请求的状态,---%>s则指的是最后请求的状态。
%t时间,用普通日志时间格式(标准英语格式)
%{format}t时间,用strftime(3)指定的格式表示的时间。(默认情况下按本地化格式)
%T处理完请求所花时间,以秒为单位。
%u远程用户名(根据验证信息而来;如果返回status(%s)为401,可能是假的)
%U请求的URL路径,不包含查询字符串。
%v对该请求提供服务的标准ServerName
%V根据UserCanonicalName指令设定的服务器名称。
%X请求完成时的连接状态:
X=连接在应答完成前中断。
+=应答传送完后继续保持连接。
-=应答传送完后关闭连接。

(在1.3以后的版本中,这个指令是%c,但这样就和过去的SSL语法:%{var}c冲突了)

%I接收的字节数,包括请求头的数据,并且不能为零。要使用这个指令你必须启用mod_logio模块。
%O发送的字节数,包括请求头的数据,并且不能为零。要使用这个指令你必须启用mod_logio模块。

按照日或小时记录请求日志
======================================
使用CustomLog及rotatelogs(已经在apache的bin目录下包含:rotatelogs.exe.linux下目录可能不同):
CustomLog "| bin/rotatelogs logs/access_log.%Y-%m-%d 86400" combined
该配置会将日志输出到另一程序,而非文件.即:rotatelogs.exe.这样,我们就可以在不重启Apache的情况下来生成新的文件.该脚本会在指定时间自动开启新文件,并写入日志.
rotatelogs第一个参数是日志文件的文件路径和名:logs/access_log.%Y-%m-%d 86400 如果它包含有一个以上的%字符,则会被作为strftime(3)的格式字符串来处理;如上面的格式表示年月晶.否则,一个十位数长的更新时间( 秒为单位)会被附加到文件名上.如:若文件名为foo,则会产生如foo.1234567890的日志文件.而上面的文件则会产生:access_log.2011-04-25这样的文件.
第二个参数是两次更新时间的间隔(以秒为单位).当系统时间是此参数值的倍数时,它就会产生更新操作.如,一天有86400秒,若设定此境遇早每天午夜就会产生新的日志文件.

Apache日志优化