首页 > 代码库 > Rewrite规则简介
Rewrite规则简介
Rewirte主要的功能就是实现URL的跳转,它的正则表达式是基于Perl语言。可基于服务器级的(httpd.conf)和目录级的(.htaccess)两种方式。如果要想用到rewrite模块,必须先安装或加载rewrite模块。方法有两种一种是编译apache的时候就直接安装rewrite模块,别一种是编译apache时以DSO模式安装apache,然后再利用源码和apxs来安装rewrite模块。这tm都是废话,反正我用了,那就肯定是我的服务器已经支持了,我们买服务器的时候也肯定会主要到能不能支持htaccess文件了。
基于服务器级的(httpd.conf)有两种方法,一种是在httpd.conf的全局 下直接利用RewriteEngine on来打开rewrite功能;另一种是在局部里利用RewriteEngine on来打开rewrite功能,下面将会举例说明,需要注意的是,必须在每个virtualhost里RewriteEngine on来打开rewrite功能。否则virtualhost里没有RewriteEngine on它里面的规则也不会生效。这里针对的就是vps服务器的了,如果你是虚拟主机,就你想动(httpd.conf)文件你也没有权限。哈
基于目录级的(.htaccess),要注意一点那就是必须打开此目录的FollowSymLinks属性且在.htaccess里要声明RewriteEngine on。这就重要了,一般我们买的虚拟主机,就是开启这个功能的,所以你在空间中任意目录下放入这个文件,都可以起作用的了。
放两个在htaccess中使用的例子:
URL重定向:
#这个是URL重定向用的,用于将不带www的域名重定向到www的域名上。 RewriteCond %{HTTP_HOST} ^(domain\.com)(:80)? [NC] RewriteRule ^(.*) http://www.domain.com/$1 [R=301,L] order deny,allow
重定向子目录到子域名:
# 重定向domain.com/forums 到 bbs.domain.com RewriteCond %{REQUEST_URI} ^/forums/ RewriteRule /domain/(.*) http://bbs.domain.com/$1 [R=permanent,L]
以上是一些简单的规则,带啊不明白可以往下拉,然后看看详细的解释。
先看看这些是什么意思
%{HTTP_HOST} 得到主域名(比如http://www.ttwrite.com)
%{REQUEST_URI} 得到除主域名之外的URL部分(比如/index.php?p=12)
%{REQUEST_FILENAME} 得到请求的文件名
这里有一个实例,请看图片
如果访问localhost/pc/tind.php,打印出如下图的结果。那我们得到上述结果
我又使用 localhost/pc/t 测试访问目录t下的index.php文件,打印如下图。请注意,这里使用的url是不带结尾斜杠的,当时,当访问时就会自动追加上结尾的“/”了。所以得到的REQUEST_URI也一定是以“/”结尾的。
好了,现在大家知道了%{HTTP_HOST} 和%{REQUEST_URI}是什么意思了。
接下来我们了解一下两个转换方法RewriteCond和RewriteRule
RewriteCond指令定义了规则生效的条件,且在一个RewriteRule指令之 前可以有一个或多个RewriteCond指令。 条件之后的重写规则RewriteRule仅在当前URI与Pattern匹配并且满足此处的条件(TestString能够与CondPattern匹 配)时才会起作用。
就是说RewriteCond和RewriteRule是成组使用的,其中RewriteCond可以为多个。RewriteCond来指定匹配的条件,RewriteRule来指定满足条件的式将进行那种转换。前者称为条件,后者称为规则。
一至多个条件加一条规则组合成一个URL重写规则。如:
RewriteCond %{HTTP_HOST} ^www.zzz.com RewriteCond %{REQUEST_URI} !^user\.php$ RewriteCond %{REQUEST_URI} \.php$ RewriteRule (.*)\.php$ http://www.zzz.com/$1/ [R]
以上面代码进行讲解,两个命令的使用格式如下。
【说明】定义重写发生的条件
【语法】RewriteCond TestString CondPattern [flags]
【说明】定义重写的规则
【语法】RewriteRule CondPattern rewritePattern [flags]
TestString是要匹配的对象变量,CondPattern是匹配条 件,rewritePattern 是重写规则,flags是扩展规则标记。
以第一句【RewriteCond %{HTTP_HOST} ^www.zzz.com】
分析:%{HTTP_HOST}作为 TestString对象,代表的是请求主域名地址。【^www.zzz.com】,作为CondPattern 是针对TestString对象进行的条件匹配,这里是表示以www.zzz.com开头的意思。
以【RewriteRule (.*)\.php$ http://www.zzz.com/$1/ [R]】来分析:
【(.*)\.php$】作为CondPattern,是针对以上三个条件匹配之后的URL进行条件筛选,表示任何一.php结尾的 URL。【http://www.zzz.com/$1/】作为rewritePattern,意思是将条件CondPattern所匹配的URL进行重组,这里意思是将CondPattern中第一个括号匹配的部分放在http://www.zzz.com/之后组合成新的URL。【[R]】作为扩展规则标记flags,意思是强制重定向。
好了,来看看这些标记都是什么意思
redirect|R [=code] (强制重定向 redirect)
以 http://thishost[:thisport]/(使新的URL成为一个URI) 为前缀的Substitution可以强制性执行一个外部重定向。 如果code没有指定,则产生一个HTTP响应代码302(临时性移动)。 如果需要使用在300-400范围内的其他响应代码,只需在此指定这个数值即可, 另外,还可以使用下列符号名称之一: temp (默认的), permanent, seeother. 用它可以把规范化的URL反馈给客户端,如, 重写“/~”为 “/u/”,或对/u/user加上斜杠,等等。
注意: 在使用这个标记时,必须确保该替换字段是一个有效的URL! 否则,它会指向一个无效的位置! 并且要记住,此标记本身只是对URL加上 http://thishost[:thisport]/的前缀,重写操作仍然会继续。 通常,你会希望停止重写操作而立即重定向,则还需要使用’L’标记.
forbidden|F (强制URL为被禁止的 forbidden)
强制当前URL为被禁止的,即,立即反馈一个HTTP响应代码403(被禁止的)。 使用这个标记,可以链接若干RewriteConds以有条件地阻塞某些URL。
gone|G’(强制URL为已废弃的 gone)
强制当前URL为已废弃的,即,立即反馈一个HTTP响应代码410(已废弃的)。 使用这个标记,可以标明页面已经被废弃而不存在了.
proxy|P (强制为代理 proxy)
此标记使替换成分被内部地强制为代理请求,并立 即(即, 重写规则处理立即中断)把处理移交给代理模块。 你必须确保此替换串是一个有效的(比如常见的以 http://hostname开头的)能够为Apache代理模块所处理的URI。 使用这个标记,可以把某些远程成分映射到本地服务器名称空间, 从而增强了ProxyPass指令的功能。
注意: 要使用这个功能,代理模块必须编译在Apache服务器中。 如果你不能确定,可以检查“httpd -l”的输出中是否有mod_proxy.c。 如果有,则mod_rewrite可以使用这个功能; 如果没有,则必须启用mod_proxy并重新编译“httpd”程序。
last|L (最后一个规则 last)
立即停止重写操作,并不再应用其他重写规则。 它对应于Perl中的last命令或C语言中的break命令。 这个标记可以阻止当前已被重写的URL为其后继的规则所重写。 举例,使用它可以重写根路径的URL(’/’)为实际存在的URL, 比如, ‘/e/www/’.
next|N (重新执行 next round)
重新执行重写操作(从第一个规则重新开始). 这时再次进行处理的URL已经不是原始的URL了,而是经最后一个重写规则处理的URL。 它对应于Perl中的next命令或C语言中的continue命令。 此标记可以重新开始重写操作,即, 立即回到循环的头部。
但是要小心,不要制造死循环!
chain|C (与下一个规则相链接 chained)
此标记使当前规则与下一个(其本身又可以与其后 继规则相链接的, 并可以如此反复的)规则相链接。 它产生这样一个效果: 如果一个规则被匹配,通常会继续处理其后继规则, 即,这个标记不起作用;如果规则不能被匹配, 则其后继的链接的规则会被忽略。比如,在执行一个外部重定向时, 对一个目录级规则集,你可能需要删除“.www” (此处不应该出现“.www”的)。
type|T=MIME-type(强制MIME类型 type)
强制目标文件的MIME类型为MIME-type。 比如,它可以用于模拟mod_alias中的ScriptAlias指令, 以内部地强制被映射目录中的所有文件的MIME类型为“application/x-httpd-cgi”。
nosubreq|NS (仅用于不对内部子请求进行处理 no internal sub-request)
在当前请求是一个内部子请求时,此标记强制重写 引擎跳过该重写规则。 比如,在mod_include试图搜索可能的目录默认文件(index.xxx)时, Apache会内部地产生子请求。对子请求,它不一定有用的,而且如果整个规则集都起作用, 它甚至可能会引发错误。所以,可以用这个标记来排除某些规则。
根据你的需要遵循以下原则: 如果你使用了有CGI脚本的URL前缀,以强制它们由CGI脚本处理, 而对子请求处理的出错率(或者开销)很高,在这种情况下,可以使用这个标记。
nocase|NC (忽略大小写 no case)
它使Pattern忽略大小写,即, 在Pattern与当前URL匹配时,’A-Z’ 和’a-z’没有区别。
qsappend|QSA (追加请求串 query string append)
此标记强制重写引擎在已有的替换串中追加一个请求串,而不是简单的替换。 如果需要通过重写规则在请求串中增加信息,就可以使用这个标记。
noescape|NE (在输出中不对URI作转义 no URI escaping)
此标记阻止mod_rewrite对重写结果应用常规的URI转义规则。 一般情况下,特殊字符(如’%’, ‘$’, ‘;’等)会被转义为等值的十六进制编码。 此标记可以阻止这样的转义,以允许百分号等符号出现在输出中,如:
RewriteRule /foo/(.*) /bar?arg=P1\=$1 [R,NE] 可以使’/foo/zed’转向到一个安全的请求’/bar?arg=P1=zed’.
passthrough|PT (移交给下一个处理器 pass through)
此标记强制重写引擎将内部结构 request_rec中的uri字段设置为 filename字段的值,它只是一个小修改,使之能对来自其他URI到文件名翻译器的 Alias,ScriptAlias, Redirect 等指令的输出进行后续处理。举一个能说明其含义的例子: 如果要通过mod_rewrite的重写引擎重写/abc为/def, 然后通过mod_alias使/def转变为/ghi,可以这样:
如果省略了PT标记,虽然mod_rewrite运作正常, 即, 作为一个使用API的URI到文件名翻译器, 它可以重写uri=/abc/…为filename=/def/…, 但是,后续的mod_alias在试图作URI到文件名的翻译时,则会失效。
注意: 如果需要混合使用不同的包含URI到文件名翻译器的模块时, 就必须使用这个标记。。 混合使用mod_alias和mod_rewrite就是个典型的例子。
For Apache hackers
如果当前Apache API除了URI到文件名hook之外,还有一个文件名到文件名的hook, 就不需要这个标记了! 但是,如果没有这样一个hook,则此标记是唯一的解决方案。 Apache Group讨论过这个问题,并在Apache 2.0 版本中会增加这样一个hook。
skip|S=num (跳过后继的规则 skip)
此标记强制重写引擎跳过当前匹配规则后继的num个规则。 它可以实现一个伪if-then-else的构造: 最后一个规则是then从句,而被跳过的skip=N个规则是else从句. (它和’chain|C’标记是不同的!)
env|E=VAR:VAL (设置环境变量 environment variable)
此标记使环境变量VAR的值为VAL, VAL可以包含可扩展的反向引用的正则表达式$N和%N。 此标记可以多次使用以设置多个变量。 这些变量可以在其后许多情况下被间接引用,但通常是在XSSI (via ) or CGI (如 $ENV{’VAR’})中, 也可以在后继的RewriteCond指令的pattern中通过%{ENV:VAR}作引用。 使用它可以从URL中剥离并记住一些信息。
cookie|CO=NAME:VAL:domain[:lifetime[:path]] (设置cookie)
它在客户端浏览器上设置一个cookie。 cookie的名称是NAME,其值是VAL。 domain字段是该cookie的域,比如’.apache.org’, 可选的lifetime是cookie生命期的分钟数, 可选的path是cookie的路径。
RewriteRule指令格式
【说明】定义重写的规则
【语法】RewriteRule Pattern rewritePattern [flags]
RewriteRule指令,可以定义一条重写 规则,规则间的顺序非常重要。对Apache1.2及以后的版本,模板(Pattern)是一个POSIX正则式,用以匹配当前的URL。当前的URL不 一定是最初提交的URL,因为可能用一些规则在此规则前已经对URL进行了处理。rewritePattern 大多数文章写为Substitution ,这里为了更清楚的认识故写为rewritePattern 。
“.” ——————- 换行符以外的所有字符
“\w” —————- 匹配字母或数字或下划线或汉字
“\s” —————– 匹配任意的空白符
“\d” —————– 匹配数字
“\b” —————– 匹配单词的开始或结束
“^” —————— 匹配字符串的开始
“$” —————— 匹配字符串的结束
“*” —————— 重复零次或更多次
“+” —————— 重复一次或更多次
“?” ——————- 重复零次或一次
“{n}” —————- 重复n次
“{n,}” ————— 重复n次或更多次
“{n,m}” ————- 重复n到m次
“[0-9]” ————– 匹配单个数字
来给出一个具体的例子吧
RewriteRule index.html index.php 比如:http://www.andelse.cn/index.html -> http://www.andelse.cn/index.php RewriteRule ^test([0-9]*).html$ test.php?id=$1 比如:http://www.andelse.cn/test8.html -> http://www.andelse.cn/test.php?id=8 RewriteRule ^cat-([0-9]+)-([0-9]+)\.html$ cat.php?id1=$1&id2=$2 比如:http://www.andelse.cn/cat-1-3.html -> http://www.andelse.cn/cat.php?id1=1&id2=3 RewriteRule ^cat-([a-zA-Z0-9\-]*)-([0-9]+)-([0-9]+)\.html$ cat.php?id0=$1&id1=$2&id2=$3 比如:http://www.andelse.cn/cat-zbc2ac-3-5.html -> http://www.andelse.cn/cat.php?id0=zbc2ac&id1=3&id2=5 RewriteRule ^cat1-([0-9]+)-([0-9]+)-([0-9]+)\.html$ cat1.php?id1=$1&id2=$2&id3=$3 比如:http://www.andelse.cn/cat1-4-3-8.html -> http://www.andelse.cn/cat1.php?id1=4&id2=3&id3=8 RewriteRule ^cat([0-9]*)/$ cat.php?id1=$1 比如:http://www.andelse.cn/cat5/ -> http://www.andelse.cn/cat.php?id1=5 RewriteRule ^catm([0-9]*)/([0-9]*)/$ catm.php?id1=$1&id2=$2 比如:http://www.andelse.cn/catm6/3/ -> http://www.andelse.cn/catm.php?id1=6&id2=3
最后再看看看rewriteCond指令吧,似乎顺序有问题,不影响阅读了....
RewriteCond指令格式
【说明】定义重写发生的条件
【语法】RewriteCond TestString CondPattern [flags]
RewriteCond指令定义一条规则条件。在一条RewriteRule指令前面可能会有一条或多条RewriteCond指令,只有当RewriteCond的条件(CondPattern)匹配成功时,RewriteRule的重写规则才被应用于当前URL处理。
TestString是一个纯文本的字符串,除了包含普通的字符外,还可以包括下列的变量结构扩展:
RewriteMap扩展:引用方法是:${mapname:key|default} 细节请参见RewriteMap指令 。
TestString可以包含服务器变量 ,引用方法是:%{NAME_OF_VARIABLE}
NAME_OF_VARIABLE可以是下表列出的字符串之一:
HTTP头连接与请求 | 服务器自身 | 日期和时间 | 其它 |
HTTP_USER_AGENT | DOCUMENT_ROOT | TIME_YEAR | API_VERSION |
HTTP_REFERER | SERVER_ADMIN | TIME_MON | THE_REQUEST |
HTTP_COOKIE | SERVER_NAME | TIME_DAY | REQUEST_URI |
HTTP_FORWARDED | SERVER_ADDR | TIME_HOUR | REQUEST_FILENAME |
HTTP_HOST | SERVER_PORT | TIME_MIN | IS_SUBREQ |
HTTP_PROXY_CONNECTION | SERVER_PROTOCOL | TIME_SEC | HTTPS |
HTTP_ACCEPT | SERVER_SOFTWARE | TIME_WDAY | |
REMOTE_ADDR | TIME | ||
REMOTE_HOST | |||
REMOTE_PORT | |||
REMOTE_USER | |||
REMOTE_IDENT | |||
REQUEST_METHOD | |||
SCRIPT_FILENAME | |||
PATH_INFO | |||
QUERY_STRING | |||
AUTH_TYPE |
这些变量都对应于类似命名的HTTP MIME头、Apache服务器的C变量、Unix系统中的struct tm字段,其中的大多数在其他的手册或者CGI规范中都有说明。 其中有mod_rewrite所特有的变量如下:
IS_SUBREQ
如果正在处理的请求是一个子请求,它将包含字符串”true”,否则就是”false”。 模块为了解析URI中的附加文件,可能会产生子请求。
API_VERSION
这是正在使用中的Apache模块API(服务 器和模块之间内部接口)的版本, 其定义位于include/ap_mmn.h中。 此模块API版本对应于正在使用的Apache的版本(比如在Apache 1.3.14的发行版中这个值是19990320:10)。 通常,对它感兴趣的是模块的开发者。
THE_REQUEST
这是由浏览器发送的完整的HTTP请求行(比如:”GET /index.html HTTP/1.1″)。 它不包含任何浏览器发送的其它头信息。
REQUEST_URI
这是在HTTP请求行中所请求的资源(比如上述例子中的”/index.html”)。
REQUEST_FILENAME
这是与请求相匹配的完整的本地文件系统的文件路径名。
HTTPS
如果连接使用了SSL/TLS,它将包含字符串”on”,否则就是”off”(无论mod_ssl 是否已经加载,该变量都可以安全的使用)。
其它注意事项:
SCRIPT_FILENAME和 REQUEST_FILENAME包含的值是相同的——即Apache服务器内部的request_rec结构中的 filename字段。 第一个就是大家都知道的CGI变量名,而第二个则是REQUEST_URI(request_rec结构中的uri字段)的一个副本。
- 特殊形式:%{ENV:variable} ,其中的variable可以是任意环境变量。 它是通过查找Apache内部结构或者(如果没找到的话)由Apache服务器进程通过getenv()得到的。
- 特殊形式:%{SSL:variable} ,其中的variable可以是一个SSL环境变量 的名字,无论mod_ssl 模块是否已经加载都可以使用(未加载时为空字符串)。 比如:%{SSL:SSL_CIPHER_USEKEYSIZE}将会被替换为128。
- 特殊形式:%{HTTP:header} ,其中的header可以是任意HTTP MIME头的名称。 它总是可以通过查找HTTP请求而得到。 比如:%{HTTP:Proxy-Connection}将被替换为Proxy-Connection:HTTP头的值。
- 预设形式:%{LA-U:variable} ,variable的最终值在执行一个内部(基于URL的)子请求后确定。 当需要使用一个目前未知但是会在之后的过程中设置的变量的时候,就可以使用这个方法。 例如,需要在服务器级配置(httpd.conf文件)中根据REMOTE_USER变量进行重写, 就必须使用%{LA-U:REMOTE_USER}。 因为此变量是由URL重写(mod??_rewrite)步骤之后的认证步骤设置的。 但是另一方面,因为mod_rewrite是通过API修正步骤来实现目录级(.htaccess文件)配置的, 而认证步骤先于API修正步骤,所以可以用%{REMOTE_USER}。
- 预设形式:%{LA-F:variable} ,variable的最终值在执行一个内部(基于文件名的)子请求后确定。 大多数情况下和上述的LA-U是相同的。
●CondPattern是条件模式,即一个应用于当前TestString实例的正则表达式。TestString将被首先计算,然后再与CondPattern匹配。
注意:CondPattern是一个perl兼容的正则表达式,但是还有若干增补:
1、可以在CondPattern串的开头使用”!’(惊叹号)来指定 不匹配 。
2、CondPatterns有若干特殊的变种。 除了正则表达式的标准用法,还有下列用法:
“<CondPattern”————-(词典顺序的小于)
将CondPattern视为纯字符串,与TestString按词典顺序进行比较。 如果TestString小于CondPattern则为真。
“>CondPattern”————-(词典顺序的大于)
将CondPattern视为纯字符串,与TestString按词典顺序进行比较。 如果TestString大于CondPattern则为真。
“=CondPattern”————-(词典顺序的等于)
将CondPattern视为纯字符串,与TestString按词典顺序进行比较。 如果TestString等于CondPattern(两个字符串逐个字符地完全相等)则为真。
如果CondPattern是”"—(两个双引号),则TestString将与空字符串进行比较。
“-d”————-(目录)
将TestString视为一个路径名并测试它是否为一个存在的目录。
“-f “————-(常规文件)
将TestString视为一个路径名并测试它是否为一个存在的常规文件。
“-s “————-(非空的常规文件)
将TestString视为一个路径名并测试它是否为一个存在的、尺寸大于0的常规文件。
“-l “————-(符号连接)
将TestString视为一个路径名并测试它是否为一个存在的符号连接。
“-x “————-(可执行)
将TestString视为一个路径名并测试它是否为一个存在的、具有可执行权限的文件。 该权限由操作系统检测。
“-F “————-(对子请求存在的文件)
检查TestString是否为一个有效的文件,而且可以在服务器当前的访问控制配置下被访问。 它使用一个内部子请求来做检查,由于会降低服务器的性能,所以请谨慎使用!
“-U “————-(对子请求存在的URL)
检查TestString是否为一个有效的URL,而且可以在服务器当前的访问控制配置下被访问。 它使用一个内部子请求来做检查,由于会降低服务器的性能,所以请谨慎使用!
注意: 所有这些测试都可以用惊叹号作前缀(“!”)以实现测试条件的反转。
或许比较混乱,但是这个也许是最能找到自己想要的东西了。希望对大家有用...
这些你肯定喜欢
Rewrite规则简介