首页 > 代码库 > nginx详解(一)
nginx详解(一)
nginx介绍:
官网:http://nginx.org。基于官方文档更有参考价值,所以这里基本只是以附加网址的形式翻译部分常用指令而已。
点击”简体中文“,可以看到nginx的特性总结。
1、自动索引:与Apache一样,当web服务器目录中没有首页文件index.html时,会自动将当前目录下所有的文件列出来。
2、打开文件描述符缓存:在linux中,被访问的文件的元数据首先需要被载入buffer、cache,而nginx则可以直接将页面文件的元数据信息缓存下来。
3、支持验证http referer:防盗链功能,也就是访问A网站的一个图片时,图片打不开,可能还会显示”此图片仅供B网站用户查看“。
4、sendfile:当用户请求一个网页内容时,其数据需要从网卡进入,经过tcp拆封装后,发现是送给监听在80端口的web进程时,然后给它。
web进程接受请求,发现是请求网站首页内容,于是向内核发起系统调用,要求进行I/O调取首页文件。
内核进行I/O后,将文件先放到内核内存,再复制到web进程内存,web进程再进行封装,然后再发送到内核的网络模块,最后才从网卡走掉。
这样响应数据从 “硬盘”→“内核空间”→“web进程”→“内核空间网络模块”,突然多走了一个很多路程。
而sendfile就是让数据直接从“内核空间”→“内核空间网络模块”这样走直道的,也就是数据在内核空间内就完成了响应封装。
sendfile支持的文件比较小,所以后来出现了sendfile_x64。
5、directI/O,与异步I/O(AIO)完全不同,,它是经过内核缓冲区,直接发送到磁盘上。
6、mmap支持,也就是内核空间到nginx空间的数据映射
7、平滑升级:
nginx的工作模式是有一个master主进程,和N个worker工作线程。
master主进程只复制读取配置、按需生成、回收worker工作线程。而worker线程只负责响应用户请求。
当nginx升级时只需要将二进制执行文件替换即可,当有新连接进来时,就会使用新的worker线程。而旧的连接依然会使用旧的worker线程,直到断开为止才会被回收。
8、不支持动态加载模块,不过改版的Tengine则可以。
CentOS6.4平台上nginx的安装:
1、解决依赖关系
# yum groupinstall "Development Tools" "Server Platform Deveopment"
# yum -y install openssl-devel pcre-devel
2、安装
首先添加nginx用户,实现以其运行nginx服务进程:
# groupadd -r nginx
# useradd -r -g nginx nginx
接着开始编译和安装:
# ./configure \
--prefix=/usr \
--sbin-path=/usr/sbin/nginx \
--conf-path=/etc/nginx/nginx.conf \
--error-log-path=/var/log/nginx/error.log \
--http-log-path=/var/log/nginx/access.log \
--pid-path=/var/run/nginx/nginx.pid \
--lock-path=/var/lock/nginx.lock \
--user=nginx \
--group=nginx \
--with-http_ssl_module \
--with-http_flv_module \
--with-http_stub_status_module \
--with-http_gzip_static_module \
--http-client-body-temp-path=/var/tmp/nginx/client/ \
--http-proxy-temp-path=/var/tmp/nginx/proxy/ \
--http-fastcgi-temp-path=/var/tmp/nginx/fcgi/ \
--http-uwsgi-temp-path=/var/tmp/nginx/uwsgi \
--http-scgi-temp-path=/var/tmp/nginx/scgi \
--with-pcre
# make && make install
3、为nginx提供SysV init脚本:
新建文件/etc/rc.d/init.d/nginx,内容如下:
#!/bin/sh
#
# nginx - this script starts and stops the nginx daemon
#
# chkconfig: - 85 15
# description: Nginx is an HTTP(S) server, HTTP(S) reverse \
# proxy and IMAP/POP3 proxy server
# processname: nginx
# config: /etc/nginx/nginx.conf
# config: /etc/sysconfig/nginx
# pidfile: /var/run/nginx.pid
# Source function library.
. /etc/rc.d/init.d/functions
# Source networking configuration.
. /etc/sysconfig/network
# Check that networking is up.
[ "$NETWORKING" = "no" ] && exit 0
nginx="/usr/sbin/nginx"
prog=$(basename $nginx)
NGINX_CONF_FILE="/etc/nginx/nginx.conf"
[ -f /etc/sysconfig/nginx ] && . /etc/sysconfig/nginx
lockfile=/var/lock/subsys/nginx
make_dirs() {
# make required directories
user=`nginx -V 2>&1 | grep "configure arguments:" | sed ‘s/[^*]*--user=\([^ ]*\).*/\1/g‘ -`
options=`$nginx -V 2>&1 | grep ‘configure arguments:‘`
for opt in $options; do
if [ `echo $opt | grep ‘.*-temp-path‘` ]; then
value=http://www.mamicode.com/`echo $opt | cut -d "=" -f 2`
if [ ! -d "$value" ]; then
# echo "creating" $value
mkdir -p $value && chown -R $user $value
fi
fi
done
}
start() {
[ -x $nginx ] || exit 5
[ -f $NGINX_CONF_FILE ] || exit 6
make_dirs
echo -n $"Starting $prog: "
daemon $nginx -c $NGINX_CONF_FILE
retval=$?
echo
[ $retval -eq 0 ] && touch $lockfile
return $retval
}
stop() {
echo -n $"Stopping $prog: "
killproc $prog -QUIT
retval=$?
echo
[ $retval -eq 0 ] && rm -f $lockfile
return $retval
}
restart() {
configtest || return $?
stop
sleep 1
start
}
reload() {
configtest || return $?
echo -n $"Reloading $prog: "
killproc $nginx -HUP
RETVAL=$?
echo
}
force_reload() {
restart
}
configtest() {
$nginx -t -c $NGINX_CONF_FILE
}
rh_status() {
status $prog
}
rh_status_q() {
rh_status >/dev/null 2>&1
}
case "$1" in
start)
rh_status_q && exit 0
$1
;;
stop)
rh_status_q || exit 0
$1
;;
restart|configtest)
$1
;;
reload)
rh_status_q || exit 7
$1
;;
force-reload)
force_reload
;;
status)
rh_status
;;
condrestart|try-restart)
rh_status_q || exit 0
;;
*)
echo $"Usage: $0 {start|stop|status|restart|condrestart|try-restart|reload|force-reload|configtest}"
exit 2
esac
而后为此脚本赋予执行权限:
# chmod +x /etc/rc.d/init.d/nginx
添加至服务管理列表,并让其开机自动启动:
# chkconfig --add nginx
# chkconfig nginx on
而后就可以启动服务并测试了:
# service nginx start
二、配置nginx:
Nginx的核心模块为Main和Events,此外还包括标准HTTP模块、可选HTTP模块和邮件模块,其还可以支持诸多第三方模块。Main用于配置错误日志、进程及权限等相关的参数,Events用于配置IO模型,如epoll、kqueue、select或poll等,它们是必备模块。
Nginx的主配置文件由几个段组成,这个段通常也被称为nginx的上下文,每个段的定义格式如下所示。需要注意的是,其每一个指令都必须使用分号(;)结束,否则为语法错误。
<section> {
<directive> <parameters>;
}
2.1.1 error_log
用于配置错误日志,可用于main、http、server及location上下文中;语法格式为:
error_log file | stderr [ debug | info | notice | warn | error | crit | alert | emerg ]
如果在编译nginx时使用了--with-debug选项,还可以使用如下格式打开调试功能。
error_log LOGFILE [debug_core | debug_alloc | debug_mutex | debug_event | debug_http | debug_imap];
要禁用错误日志,不能使用“error_log off;”,而要使用类似如下选项:
error_log /dev/null crit;
2.1.2 timer_resolution
用于降低gettimeofday()系统调用的次数。默认情况下,每次从kevent()、epoll、/dev/poll、select()或poll()返回时都会执行此系统调用。语法格式为:
timer_resolution interval
例如:
timer_resolution 100ms;
2.1.3 worker_priority
为worker进程设定优先级(指定nice值),此参数只能用于main上下文中,默认为0;语法格式为:
worker_priority number;(-20,20)
2.1.4 worker_processes
worker进程是单线程进程。
如果Nginx用于CPU密集型的场景中,如SSL或gzip,且主机上的CPU个数至少有2个,那么应该将此参数值设定为与CPU核心数相同;
如果Nginx用于大量静态文件访问的场景中,且所有文件的总大小大于可用内存时,应该将此参数的值设定得足够大以充分利用磁盘带宽。
此参数与Events上下文中的work_connections变量一起决定了maxclient的值:
maxclients = work_processes * work_connections
2.1.5 worker_cpu_affinity
通过sched_setaffinity()将worker绑定至CPU上,减少上下文切换,提升性能。只能用于main上下文。语法格式为:
worker_cpu_affinity cpumask ...
cpumask中的1表示cpu的那个核心被绑定了。
例如:
worker_processes 4;
worker_cpu_affinity 0001 0010 0100 1000;
worker_processes 2;
worker_cpu_affinity 01 11;
2.1.6 worker_rlimit_nofile
设定worker进程所能够打开的文件描述符个数的最大值。语法格式:
worker_rlimit_nofile number;
注意,这时如果使用ab命令测试是不行的。number一般为51200即可。
2.2 配置Events模块
2.2.1 worker_connections
设定每个worker所处理的最大连接数,它与来自main上下文的worker_processes一起决定了maxclients的值。
max clients = worker_processes * worker_connections
而在反向代理场景中,其计算方法与上述公式不同,因为默认情况下浏览器将打开2个连接,而nginx会为每一个连接打开2个文件描述符,因此,其maxclients的计算方法为:
max clients = worker_processes * worker_connections/4
2.2.2 use
在有着多于一个的事件模型IO的应用场景中,可以使用此指令设定nginx所使用的IO机制,默认为./configure脚本选定的各机制中最适用当前OS的版本。语法格式:
use [ kqueue | rtsig | epoll | /dev/poll | select | poll | eventport ]
2.3 一个配置示例
user nginx;
# the load is CPU-bound and we have 16 cores
worker_processes 16;
error_log /var/log/nginx/error.log;
pid /var/run/nginx.pid;
events {
use epoll;
worker_connections 2048;
}
2.4 HTTP服务的相关配置
http上下文专用于配置用于http的各模块,此类指令非常的多,每个模块都有其专用指定,具体请参数nginx官方wiki关于模块部分的说明。大体上来讲,这些模块所提供的配置指令还可以分为如下几个类别。
客户端类指令:如client_body_buffer_size、client_header_buffer_size、client_header_timeout和keepalive_timeout等;
文件IO类指令:如aio、directio、open_file_cache、open_file_cache_min_uses、open_file_cache_valid和sendfile等;
hash类指令:用于定义Nginx为某特定的变量分配多大的内存空间,如types_hash_bucket_size、server_names_hash_bucket_size和variables_hash_bucket_size等;
套接字类指令:用于定义Nginx如何处理tcp套接字相关的功能,如tcp_nodelay(用于keepalive功能启用时)和tcp_nopush(用于sendfile启用时)等;
listen address[:port];监听端口,必需的。
server_name HOSTNAME;一般定义在server中
下面的两个指令一般定义在server中,或者是server中的location中:
root /path/to/webroot;定义URI的起始路径,
index index.html index.php index.html
2.5 虚拟服务器相关配置
server {
<directive> <parameters>;
}
用于定义虚拟服务器相关的属性,常见的指令有backlog、rcvbuf、bind及sndbuf等。
2.6 location相关的配置
location [modifier] uri {...} 或 location @name {…}
通常用于server,或者location嵌套中,无法用在httpd段:
当某个URI想使用其他的路径,或者某个URI想具有独特的访问控制权限时,这时location就用到了。虽然location与下文将要讲到的IF指令有相同之处,但是就使用正则表达式进行URI匹配的时,location用的比IF多。
每个location下面的权限及代理内容不同,浏览器得到的内容也会受其限定。
location [ = | ^~ | ~ | ~* | 无 ] URI { … }
上面5中情况中,其优先级是依次递减:
(下面样例中,主机名均使用IP地址,而网页根目录是/web/htdocs,下面有images目录、docs目录,error目录、bbs等目录,且各目录下均由与其目录同名的网页内容的index.html文件,以方便实验)
= :做精确匹配。比如:
location = /images {
root /web/htdocs/images;
index index.html;
}
浏览器访问http://IP/images/时,就直接访问/web/htdocs/images目录中的文件了,而且其访问权限直接受此location的限制。
^~ :其后的内容不允许使用正则进行匹配。
~ :使用正则进行模式匹配,但是区分大小写。(对于点,要加反斜线)
~* :不区分大小写的模式匹配。
无 :级别最低。一般用在根下。
制作一个自定义的错误页面,防止返回给用户的是一个生硬的错误页面:
error_page 404 sorry.html;
location = /sorry.html {
root /web/htdocs/error;
}
location @name {…}
server {
location / {
set $memcached_key $uri;
memcached_pass name:11211;
default_type text/html;
error_page 404 @fallback;
}
location @fallback {
proxy_pass http://backend;
}
}
这里是memcached的一个反向代理,也就是nginx将memcached作为缓存服务器,而不是自己。当memcached没有命中时,再将这个请求发送给其他的upstream进行响应。
nginx详解(一)