首页 > 代码库 > nginx详解(一)

nginx详解(一)

nginx介绍:

        官网:http://nginx.org。基于官方文档更有参考价值,所以这里基本只是以附加网址的形式翻译部分常用指令而已。

点击”简体中文“,可以看到nginx的特性总结。

1、自动索引:与Apache一样,当web服务器目录中没有首页文件index.html时,会自动将当前目录下所有的文件列出来。

2、打开文件描述符缓存:在linux中,被访问的文件的元数据首先需要被载入buffer、cache,而nginx则可以直接将页面文件的元数据信息缓存下来。

3、支持验证http referer:防盗链功能,也就是访问A网站的一个图片时,图片打不开,可能还会显示”此图片仅供B网站用户查看“。

4、sendfile:当用户请求一个网页内容时,其数据需要从网卡进入,经过tcp拆封装后,发现是送给监听在80端口的web进程时,然后给它。

web进程接受请求,发现是请求网站首页内容,于是向内核发起系统调用,要求进行I/O调取首页文件。

内核进行I/O后,将文件先放到内核内存,再复制到web进程内存,web进程再进行封装,然后再发送到内核的网络模块,最后才从网卡走掉。

这样响应数据从 “硬盘”→“内核空间”→“web进程”→“内核空间网络模块”,突然多走了一个很多路程。

而sendfile就是让数据直接从“内核空间”→“内核空间网络模块”这样走直道的,也就是数据在内核空间内就完成了响应封装。

sendfile支持的文件比较小,所以后来出现了sendfile_x64。

5、directI/O,与异步I/O(AIO)完全不同,,它是经过内核缓冲区,直接发送到磁盘上。

6、mmap支持,也就是内核空间到nginx空间的数据映射

7、平滑升级:

nginx的工作模式是有一个master主进程,和N个worker工作线程。

master主进程只复制读取配置、按需生成、回收worker工作线程。而worker线程只负责响应用户请求。

当nginx升级时只需要将二进制执行文件替换即可,当有新连接进来时,就会使用新的worker线程。而旧的连接依然会使用旧的worker线程,直到断开为止才会被回收。

8、不支持动态加载模块,不过改版的Tengine则可以。

CentOS6.4平台上nginx的安装:

1、解决依赖关系

# yum groupinstall "Development Tools" "Server Platform Deveopment"
# yum -y install openssl-devel pcre-devel

2、安装

首先添加nginx用户,实现以其运行nginx服务进程:

# groupadd -r nginx
# useradd -r -g nginx nginx

接着开始编译和安装:
# ./configure \
  --prefix=/usr \
  --sbin-path=/usr/sbin/nginx \
  --conf-path=/etc/nginx/nginx.conf \
  --error-log-path=/var/log/nginx/error.log \
  --http-log-path=/var/log/nginx/access.log \
  --pid-path=/var/run/nginx/nginx.pid  \
  --lock-path=/var/lock/nginx.lock \
  --user=nginx \
  --group=nginx \
  --with-http_ssl_module \
  --with-http_flv_module \
  --with-http_stub_status_module \
  --with-http_gzip_static_module \
  --http-client-body-temp-path=/var/tmp/nginx/client/ \
  --http-proxy-temp-path=/var/tmp/nginx/proxy/ \
  --http-fastcgi-temp-path=/var/tmp/nginx/fcgi/ \
  --http-uwsgi-temp-path=/var/tmp/nginx/uwsgi \
  --http-scgi-temp-path=/var/tmp/nginx/scgi \
  --with-pcre
# make && make install

3、为nginx提供SysV init脚本:

新建文件/etc/rc.d/init.d/nginx,内容如下:
#!/bin/sh
#
# nginx - this script starts and stops the nginx daemon
#
# chkconfig:   - 85 15
# description:  Nginx is an HTTP(S) server, HTTP(S) reverse \
#               proxy and IMAP/POP3 proxy server
# processname: nginx
# config:      /etc/nginx/nginx.conf
# config:      /etc/sysconfig/nginx
# pidfile:     /var/run/nginx.pid
 
# Source function library.
. /etc/rc.d/init.d/functions
 
# Source networking configuration.
. /etc/sysconfig/network
 
# Check that networking is up.
[ "$NETWORKING" = "no" ] && exit 0
 
nginx="/usr/sbin/nginx"
prog=$(basename $nginx)
 
NGINX_CONF_FILE="/etc/nginx/nginx.conf"
 
[ -f /etc/sysconfig/nginx ] && . /etc/sysconfig/nginx
 
lockfile=/var/lock/subsys/nginx
 
make_dirs() {
   # make required directories
   user=`nginx -V 2>&1 | grep "configure arguments:" | sed ‘s/[^*]*--user=\([^ ]*\).*/\1/g‘ -`
   options=`$nginx -V 2>&1 | grep ‘configure arguments:‘`
   for opt in $options; do
       if [ `echo $opt | grep ‘.*-temp-path‘` ]; then
           value=http://www.mamicode.com/`echo $opt | cut -d "=" -f 2`
           if [ ! -d "$value" ]; then
               # echo "creating" $value
               mkdir -p $value && chown -R $user $value
           fi
       fi
   done
}
 
start() {
    [ -x $nginx ] || exit 5
    [ -f $NGINX_CONF_FILE ] || exit 6
    make_dirs
    echo -n $"Starting $prog: "
    daemon $nginx -c $NGINX_CONF_FILE
    retval=$?
    echo
    [ $retval -eq 0 ] && touch $lockfile
    return $retval
}
 
stop() {
    echo -n $"Stopping $prog: "
    killproc $prog -QUIT
    retval=$?
    echo
    [ $retval -eq 0 ] && rm -f $lockfile
    return $retval
}
 
restart() {
    configtest || return $?
    stop
    sleep 1
    start
}
 
reload() {
    configtest || return $?
    echo -n $"Reloading $prog: "
    killproc $nginx -HUP
    RETVAL=$?
    echo
}
 
force_reload() {
    restart
}
 
configtest() {
  $nginx -t -c $NGINX_CONF_FILE
}
 
rh_status() {
    status $prog
}
 
rh_status_q() {
    rh_status >/dev/null 2>&1
}
 
case "$1" in
    start)
        rh_status_q && exit 0
        $1
        ;;
    stop)
        rh_status_q || exit 0
        $1
        ;;
    restart|configtest)
        $1
        ;;
    reload)
        rh_status_q || exit 7
        $1
        ;;
    force-reload)
        force_reload
        ;;
    status)
        rh_status
        ;;
    condrestart|try-restart)
        rh_status_q || exit 0
            ;;
    *)
        echo $"Usage: $0 {start|stop|status|restart|condrestart|try-restart|reload|force-reload|configtest}"
        exit 2
esac

而后为此脚本赋予执行权限:
# chmod +x /etc/rc.d/init.d/nginx

添加至服务管理列表,并让其开机自动启动:
# chkconfig --add nginx
# chkconfig nginx on

而后就可以启动服务并测试了:
# service nginx start

二、配置nginx:

Nginx的核心模块为Main和Events,此外还包括标准HTTP模块、可选HTTP模块和邮件模块,其还可以支持诸多第三方模块。Main用于配置错误日志、进程及权限等相关的参数,Events用于配置IO模型,如epoll、kqueue、select或poll等,它们是必备模块。

Nginx的主配置文件由几个段组成,这个段通常也被称为nginx的上下文,每个段的定义格式如下所示。需要注意的是,其每一个指令都必须使用分号(;)结束,否则为语法错误。

<section> {
    <directive> <parameters>;
}

2.1.1 error_log

用于配置错误日志,可用于main、http、server及location上下文中;语法格式为:

error_log file | stderr [ debug | info | notice | warn | error | crit | alert | emerg ]

如果在编译nginx时使用了--with-debug选项,还可以使用如下格式打开调试功能。

error_log LOGFILE [debug_core | debug_alloc | debug_mutex | debug_event | debug_http | debug_imap];

要禁用错误日志,不能使用“error_log off;”,而要使用类似如下选项:

error_log /dev/null crit;

2.1.2 timer_resolution

用于降低gettimeofday()系统调用的次数。默认情况下,每次从kevent()、epoll、/dev/poll、select()或poll()返回时都会执行此系统调用。语法格式为:

timer_resolution interval

例如:

timer_resolution  100ms;


2.1.3 worker_priority

为worker进程设定优先级(指定nice值),此参数只能用于main上下文中,默认为0;语法格式为:

worker_priority number;(-20,20)

2.1.4 worker_processes

    worker进程是单线程进程。

如果Nginx用于CPU密集型的场景中,如SSL或gzip,且主机上的CPU个数至少有2个,那么应该将此参数值设定为与CPU核心数相同;

如果Nginx用于大量静态文件访问的场景中,且所有文件的总大小大于可用内存时,应该将此参数的值设定得足够大以充分利用磁盘带宽。

此参数与Events上下文中的work_connections变量一起决定了maxclient的值:
maxclients = work_processes * work_connections

2.1.5 worker_cpu_affinity

通过sched_setaffinity()将worker绑定至CPU上,减少上下文切换,提升性能。只能用于main上下文。语法格式为:

worker_cpu_affinity cpumask ...

cpumask中的1表示cpu的那个核心被绑定了。

 

例如:
worker_processes     4;
worker_cpu_affinity 0001 0010 0100 1000;

 

worker_processes     2;
worker_cpu_affinity   01 11;

 

2.1.6 worker_rlimit_nofile

设定worker进程所能够打开的文件描述符个数的最大值。语法格式:

worker_rlimit_nofile number;

注意,这时如果使用ab命令测试是不行的。number一般为51200即可。

2.2 配置Events模块

2.2.1 worker_connections

设定每个worker所处理的最大连接数,它与来自main上下文的worker_processes一起决定了maxclients的值。

max clients = worker_processes * worker_connections

而在反向代理场景中,其计算方法与上述公式不同,因为默认情况下浏览器将打开2个连接,而nginx会为每一个连接打开2个文件描述符,因此,其maxclients的计算方法为:

max clients = worker_processes * worker_connections/4

2.2.2 use

在有着多于一个的事件模型IO的应用场景中,可以使用此指令设定nginx所使用的IO机制,默认为./configure脚本选定的各机制中最适用当前OS的版本。语法格式:

use [ kqueue | rtsig | epoll | /dev/poll | select | poll | eventport ]

2.3 一个配置示例

user nginx;
# the load is CPU-bound and we have 16 cores
worker_processes 16;
error_log /var/log/nginx/error.log;
pid /var/run/nginx.pid;

events {
    use epoll;
    worker_connections 2048;
}

2.4 HTTP服务的相关配置

http上下文专用于配置用于http的各模块,此类指令非常的多,每个模块都有其专用指定,具体请参数nginx官方wiki关于模块部分的说明。大体上来讲,这些模块所提供的配置指令还可以分为如下几个类别。

客户端类指令:如client_body_buffer_size、client_header_buffer_size、client_header_timeout和keepalive_timeout等;

文件IO类指令:如aio、directio、open_file_cache、open_file_cache_min_uses、open_file_cache_valid和sendfile等;
hash类指令:用于定义Nginx为某特定的变量分配多大的内存空间,如types_hash_bucket_size、server_names_hash_bucket_size和variables_hash_bucket_size等;
套接字类指令:用于定义Nginx如何处理tcp套接字相关的功能,如tcp_nodelay(用于keepalive功能启用时)和tcp_nopush(用于sendfile启用时)等;

listen address[:port];监听端口,必需的。

server_name  HOSTNAME;一般定义在server中

下面的两个指令一般定义在server中,或者是server中的location中:

root   /path/to/webroot;定义URI的起始路径,

index  index.html index.php index.html

2.5 虚拟服务器相关配置

server {
    <directive> <parameters>;
}

用于定义虚拟服务器相关的属性,常见的指令有backlog、rcvbuf、bind及sndbuf等。

2.6 location相关的配置

location [modifier] uri {...} 或 location @name {…}

通常用于server,或者location嵌套中,无法用在httpd段:

当某个URI想使用其他的路径,或者某个URI想具有独特的访问控制权限时,这时location就用到了。虽然location与下文将要讲到的IF指令有相同之处,但是就使用正则表达式进行URI匹配的时,location用的比IF多。

每个location下面的权限及代理内容不同,浏览器得到的内容也会受其限定。

location [ = | ^~ | ~ | ~* | 无 ] URI { … }

上面5中情况中,其优先级是依次递减:

(下面样例中,主机名均使用IP地址,而网页根目录是/web/htdocs,下面有images目录、docs目录,error目录、bbs等目录,且各目录下均由与其目录同名的网页内容的index.html文件,以方便实验)

= :做精确匹配。比如:

location = /images {

        root    /web/htdocs/images;

        index    index.html;

}

浏览器访问http://IP/images/时,就直接访问/web/htdocs/images目录中的文件了,而且其访问权限直接受此location的限制。

^~ :其后的内容不允许使用正则进行匹配。

~  :使用正则进行模式匹配,但是区分大小写。(对于点,要加反斜线)

~* :不区分大小写的模式匹配。

无 :级别最低。一般用在根下。

制作一个自定义的错误页面,防止返回给用户的是一个生硬的错误页面:

error_page 404 sorry.html;

location = /sorry.html {

    root    /web/htdocs/error;

}

   

location @name {…}

server {
  location / {
    set $memcached_key $uri;
    memcached_pass     name:11211;
    default_type       text/html;
    error_page         404 @fallback;
  }
 
  location @fallback {
    proxy_pass
http://backend;
  }
}

这里是memcached的一个反向代理,也就是nginx将memcached作为缓存服务器,而不是自己。当memcached没有命中时,再将这个请求发送给其他的upstream进行响应。

nginx详解(一)