首页 > 代码库 > nginx源码分析--模块分类
nginx源码分析--模块分类
ngx-modules
Nginx 主要的模块大致可以分为四类:
handler – 协同完成客户端请求的处理、产生响应数据。比如模块,
ngx_http_rewrite_module
,ngx_http_log_module
,ngx_http_static_module
。filter – 对 handler 产生的响应数据做各种过滤处理。比如模块,
ngx_http_not_modified_filter_module
,ngx_http_header_filter_module
。upstream – upstream 模块使 Nginx 可以充当反向代理,只对客户端请求进行转发。比 如,
ngx_http_proxy_module
,ngx_http_fastcgi_module
。loadbalance – 在 Nginx 充当反向代理时,通过 loadbalance 模块的策略选择处理某次 请求的后端服务器节点。
比如,对一个普通的访问本地静态文件的请求处理,从 Nginx 收到请求并开始处理,到处 理结果的响应包体发送到网络上结束,整个过程的两个步骤 – 请求处理和响应处理 – 分别 由 handler 和 filter 处理完成。
严格来说,upstream 模块 (proxy, fastcgi 等),也是请求处理的一部分,它们从网络获 取请求的响应内容。
下面只分析一下 handler 模块和 filter 模块的注册和调用逻辑。
handler 模块
Nginx 将请求的处理阶段分为了下面列出的11个 phase ,如果某个 handler 模块需要在某 个 phase 中被调用时,需要在 postconfiguration 时将 handler 模块的入口函数注册到 Nginx 中。
-----------http/ngx_http_core_module.h:86-------------
typedef enum {
NGX_HTTP_POST_READ_PHASE = 0,
NGX_HTTP_SERVER_REWRITE_PHASE,
NGX_HTTP_FIND_CONFIG_PHASE,
NGX_HTTP_REWRITE_PHASE,
NGX_HTTP_POST_REWRITE_PHASE,
NGX_HTTP_PREACCESS_PHASE,
NGX_HTTP_ACCESS_PHASE,
NGX_HTTP_POST_ACCESS_PHASE,
NGX_HTTP_TRY_FILES_PHASE,
NGX_HTTP_CONTENT_PHASE,
NGX_HTTP_LOG_PHASE
} ngx_http_phases;
一个请求对应的 phase
会随着程序的执行发生变化。同时,在请求的实际处理过程中, 会因等待事件或者子请求等导致请求在不同的 phase 反复处理,但是在任意时刻,对某个 指定的客户端请求而言,它总是处于某个确定的 phase 中。这里先暂时将这个 phase 的转 化过程称为phase machine。整个 phase machine 的退出点就是请求的完全处理结束。
处理函数注册
所有的 phase 和在各 phase 注册的入口函数,都临时保存在 ngx_http_core_module
的 main conf
中的配置结构体ngx_http_core_main_conf_t
的 phases
成员中:
----------http/ngx_http_core_module.h:125-------------
typedef struct {
ngx_array_t handlers;
} ngx_http_phase_t;
typedef struct {
...
ngx_http_phase_engine_t phase_engine;
...
ngx_http_phase_t phases[NGX_HTTP_LOG_PHASE + 1]
} ngx_http_core_main_conf_t;
拿 ngx_http_rewrite_module
举例,其模块的 postconfiguration
对应回调函数ngx_http_rewrite_init
:
-----------http/modules/ngx_http_rewrite_module.c:104-----
static ngx_http_module_t ngx_http_rewrite_module_ctx = {
NULL, /* preconfiguration */
ngx_http_rewrite_init, /* postconfiguration */
NULL, /* create main configuration */
NULL, /* init main configuration */
NULL, /* create server configuration */
NULL, /* merge server configuration */
ngx_http_rewrite_create_loc_conf, /* create location configuration */
ngx_http_rewrite_merge_loc_conf, /* merge location configuration */
};
在 ngx_http_rewrite_init
中,将 ngx_http_rewrite_module
的入口函数注册到了NGX_HTTP_SERVER_REWRITE_PHASE
和 NGX_HTTP_REWRITE_PHASE
两个 phase 中:
-----------http/modules/ngx_http_rewrite_module.c:266-------
static ngx_int_t
ngx_http_rewrite_init(ngx_conf_t *cf)
{
...
cmcf = ngx_http_conf_get_module_main_conf(cf, ngx_http_core_module);
h = ngx_array_push(&cmcf->phases[NGX_HTTP_SERVER_REWRITE_PHASE].handlers;
...
*h = ngx_http_rewrite_handler;
h = ngx_array_push(&cmcf->phases[NGX_HTTP_REWRITE_PHASE].handlers;
...
*h = ngx_http_rewrite_handler;
...
}
然后,在所有 handler 模块的入口函数都注册完毕后,ngx_http_core_module
会将所有 入口函数封装成 ngx_http_phase_handler_t
类型变量后,线性化存储到 cmcf->phase_engine
中,同时在连续内存基础上,使用next
成员再次生成一个链表 (通过数组索引链接)。ngx_http_phase_handler_t
类型变量的checker
成员函数,决 定一个请求在 phase machine
中,在当前 phase 的当前 handler 函数处理完后,是该 调用同一 phase 中的下一个 handler 函数处理,还是直接进行下一个 phase (checker
可以认为是 phase 的调度函数)。
同时,在线性化过程中,还加入了 Nginx 内建 phase (find_config
, post_rewrite
,post_access
, try_files
)的 checker
函数,这些 phase 原本身并不和任何模块的 handler 处理函数相对应 。
---------http/ngx_http_core_module.h:111--------------
sturct ngx_http_phase_handler_s {
ngx_http_phase_handler_pt checker;
ngx_http_handler_pt handler;
ngx_uint_t next;
};
typedef struct {
ngx_http_phase_handler_t *handlers;
ngx_uint_t server_rewrite_index;
ngx_uint_t location_rewrite_index;
} ngx_http_phase_engine_t;
线性化处理由函数 ngx_http_init_phase_handlers
完成,它在所有 http 模块的 postconfiguration
被调用完成后执行:
---------http/ngx_http.c:328------
for (m = 0; ngx_modules[m]; m++) {
...
if (module->postconfiguration) {
if (module->postconfiguration(cf) != NGX_OK) {
return NGX_CONF_ERROR;
}
}
}
...
if (ngx_http_init_phase_handlers(cf, cmcf) != NGX_OK) {
return NGX_CONF_ERROR;
}
ngx_http_init_phase_handlers
执行完后,各 phase 中注册的回调函数被封装成 ngx_http_phase_handler_t
类型的变量,其字段的 checker 和 next 最终值总结如下:
phase checker next
------------------------------------------------------------------------
POST_READ ngx_http_core_generic_phase 下一个 phase
SERVER_REWRITE ngx_http_core_generic_phase 下一个 phase
FIND_CONFIG ngx_http_core_find_config_phase 0
REWRITE ngx_http_core_generic_phase 下一个 phase
POST_REWRITE ngx_http_core_post_rewrite_phase FIND_CONFIG phase
PREACCESS ngx_http_core_generic_phase 下一个 phase
ACCESS ngx_http_core_access_phase 下下一个 phase (跳过 post_access phrase)
POST_ACCESS ngx_http_core_post_access_phase 下一个 phase
TRY_FILES ngx_http_core_try_files_phase 0
CONTENT ngx_http_core_content_phase NULL
------------------------------------------------------------------------
其中,各个 phase 的 checker 的行为如下:
checker behavior
------------------------------------------------------------------------
ngx_http_core_generic_phase NGX_OK时,进入下一个 phase,
NGX_DECLINED时,下一个 handler
ngx_http_core_find_config_phase 下一个 handler
ngx_http_core_post_rewrite_phase 下一个 phase,即 FIND_CONFIG_PHASE
ngx_http_core_access_phase NGX_OK时,进入下一个 phase,
NGX_DECLINED, NGX_HTTP_FORBIDDEN,
NGX_HTTP_UNAUTHORIZED时,下一个 handler
ngx_http_core_post_access_phase r->access_code 不为0时,结束请求
否则,继续下一个 handler
ngx_http_core_try_files_phase 下一个 handler
ngx_http_core_content_phase 下一个 handler,或者结束请求
------------------------------------------------------------------------
另外一个需要注意的地方是,在 ngx_http_init_phase_handlers
中,只给 cmcf->phase_engine.handlers
分配了多余的sizeof(void *)
个字节用于存储 handlers
结束标识 NULL
:
---------http/ngx_http.c:488---------------
n = use_rewrite + use_access + cmcf->try_files + 1 /* find config phase */;
for (i = 0; i < NGX_HTTP_LOG_PHASE; i++) {
n += cmcf->phases[i].handlers.nelts;
}
ph = ngx_pcalloc(cf->pool, n * sizeof(ngx_http_phase_handler_t) + sizeof(void *));
而在随后的使用中,只检查了 ngx_http_phase_handler_t
的第一个字段,即 checker
, 来判断是否到了ngx_http_phase_handler_t
数组的末尾。这是有意为之,还是疏忽的地 方? 虽然代码可以正常运行,但是…
--------http/ngx_http_core_module.c:836---------
void
ngx_http_core_run_phases(ngx_http_request_t *r)
{
...
while (ph[r->phase_handler].checker) {
rc = ph[r->phase_handler].checker(r, &ph[r->phase_handler]);
...
}
}
处理函数调用
在 Nginx 正常启动后,开始处理客户端请求。在处理客户端请求的过程中,就会根据请求 处于的 phase ,调用已注册到相应 phase 的回调函数,对请求进行处理。
当一个 HTTP 请求到达 Nginx 后,Nginx 会依次调用下面的处理函数 (先简单列出,等专 门再辟出一文对 HTTP 请求的“一生”进行详细描述):
- ngx_http_init_connection
- ngx_http_init_request
- ngx_http_process_request_line
- ngx_http_process_request_headers
- ngx_http_process_request
- ngx_http_handler
- ngx_http_core_run_phasess
最后一个函数 ngx_http_core_run_phases
就是这个 phase machine 的驱动函数:
-----------http/ngx_http_core_module.c:836--------
void
ngx_http_core_run_phases(ngx_http_request_t *r)
{
...
cmcf = ngx_http_get_module_main_conf(r, ngx_http_core_module);
ph = cmcf->phase_engine.handlers;
while (ph[r->phase_handler].checker) {
rc = ph[r->phase_handler].checker(r, &ph[r->phase_handler]);
if (rc == NGX_OK) {
return;
}
}
}
随后,整个请求处理的主要逻辑都是在这个 phase machine 中完成的。详细的处理逻辑 以后再分析,这篇关注的是 handler 模块的注册和调用逻辑。
filter 模块
filter 模块的初始化时间和 handler 模块一样,都是在模块的 postconfiguration
回 调函数中完成。但是,与 handler 模块函数的注册方式不同的时,filter 模块的入口函数 不需要区分 phase,同时,所有的 filter 入口函数组成output filter chain。每个请 求的响应数据都经过 output filter chain 中的每个 filter 入口函数进行处理,然后 才会发向网络。
响应数据由响应头和响应体两部分组成,分别经过响应头对应的 header output filter chain 和响应体对应的 body output filter chain 处理。
处理函数注册
output filter chain,使用两个全局变量 ngx_http_top_header
和 ngx_http_top_body_filter
分别保存第一个 header filter 和 body filter 入口函数 的地址。每个 filter 模块的局部变量ngx_http_next_header_filter
和 ngx_http_next_body_filter
保存当前 filter 模块执行完后需要调用的下一个 filter 模块的入口函数地址。这个 filter 链条在 Nginx初始化模块时完成, 比如ngx_http_addition_filter
模块的初始化函数如下:
static ngx_int_t
ngx_http_addition_filter_init(ngx_conf_t *cf)
{
ngx_http_next_header_filter = ngx_http_top_header_filter;
ngx_http_top_header_filter = ngx_http_addition_header_filter;
ngx_http_next_body_filter = ngx_http_top_body_filter;
ngx_http_top_body_filter = ngx_http_addition_body_filter;
return NGX_OK;
}
以 header output filter chain 为例,Nginx在开始返回响应数据时,调用 ngx_http_top_header_filter
和ngx_http_top_header_filter
指向的第一个 filter 模块的入口函数,第一个 filter 模块的入口函数处理完成以后,会调用其模块局部变量ngx_http_next_header_filter
和 ngx_http_next_header_filter
指向的下一个 filter 模块的入口函数,以此类推,直到ngx_http_header_filter
和 ngx_http_write_filter
模块将数据发回客户端,这个处理过程就完成了。
filter 模块入口函数的调用顺序由 filter 模块的初始化顺序决定,并且方向相反。模块 初始化顺序在 objs/ngx_modules.c
中定义:
34 extern ngx_module_t ngx_http_write_filter_module;
35 extern ngx_module_t ngx_http_header_filter_module;
36 extern ngx_module_t ngx_http_chunked_filter_module;
37 extern ngx_module_t ngx_http_range_header_filter_module;
38 extern ngx_module_t ngx_http_gzip_filter_module;
39 extern ngx_module_t ngx_http_postpone_filter_module;
40 extern ngx_module_t ngx_http_charset_filter_module;
41 extern ngx_module_t ngx_http_ssi_filter_module;
42 extern ngx_module_t ngx_http_userid_filter_module;
43 extern ngx_module_t ngx_http_headers_filter_module;
44 extern ngx_module_t ngx_http_copy_filter_module;
45 extern ngx_module_t ngx_http_range_body_filter_module;
46 extern ngx_module_t ngx_http_not_modified_filter_module;
可见,ngx_http_header_filter_module
和 ngx_http_write_filter_module
最先被初 始化,那么,其提供的filter处理函数在整个响应处理过程中被最后调用。
body output filter chain 的生成方式和 header output filter chain 类似。
处理函数调用
在请求的响应内容准备完毕,开始向客户端发送响应数据时,Nginx 会使用 ngx_http_send_header
将响应包头数据交给header output filter chain
处理。包头 数据发送完成后,再使用 ngx_http_output_filter
将响应包体数据交给body output filter chain
处理。
-----------http/ngx_http_core_module.c:1702-----------
ngx_int_t
ngx_http_send_header(ngx_http_request_t *r)
{
if (r->err_status) {
r->headers_out.status = r->err_status;
r->headers_out.status_line.len = 0;
}
return ngx_http_top_header_filter(r);
}
----------http/ngx_http_core_module.c:1713-------------
ngx_int_t
ngx_http_output_filter(ngx_http_request_t *r, ngx_chain_t *in)
{
...
rc = ngx_http_top_body_filter(r, in);
}
随后的处理流程,就是按照 处理函数注册 中构造的 output filter chain
的顺序调用 各个 filter 模块的入口函数一步一步完成的。具体的逻辑,就和各个 filter 模块本身的 功能相关了。