全面理解.htaccess语法中RewriteCond和RewriteRule意义
作者:互联网
RewriteCond
的语法
// 含义:当什么东西 匹配 某种模式,则..
RewriteCond TestString CondPattern [Flags]
RewriteCond %{HTTP_HOST} abc.com
TestString
是指一个文本格式的条件,如:环境变量名HTTP_HOST
所包含的内容(Name=Value
),这是一个map
(键值对)格式的数据类型。CondPattern
是条件参数,是正则表达式或字符串直接量,如上例就是abc.com
。Flags
标识,可以用来紧跟下一个条件,用OR
表示或者,如果没有[Flags]
,则用隐含为AND
,表示并且。其它的还可以NC
等等,表示忽略大小写
RewriteCond
就像我们程序中的if
语句一样,表示如果符合某个或某几个条件则执行RewriteCond
下面紧邻的RewriteRule
语句,这就是RewriteCond
最原始、基础的功能,例如:
RewriteEngine on
RewriteCond %{HTTP_USER_AGENT} ^Mozilla/5.0.*
# RewriteRule 当条件满足时,把url怎么改写 紧跟在RewriteCond后面
RewriteRule index.php index.m.php
RewriteCond %{HTTP_USER_AGENT} ^Lynx.*
RewriteRule index.php index.L.php
# 上面的条件都不满足时,执行下列这个改写规则
RewriteRule index.php index.b.php
上面语句的作用是当你是用FF
浏览器访问index.php
这个文件的时候,会自动让你访问到index.m.php
这个文件,当你是用一些移动终端访问的 时候,会让你对index.php
这个文件的访问实际访问的是index.L.php
去,如果你是用其它的浏览器访问的时候,会让你跳到 index.b.php
。
RewriteRule
的语法
# RewriteRule含义:把什么模式的url进行改写
RewriteRule Pattern Substitution [Flags]
Pattern
是正则或字符串字面量,表示URL
模式,一般为一些文件的扩展名,Substitution
是用来替换URL
中匹配pattern
的部分Flags
R
表示redirect
(强制重定向),F
表示forbidden
(禁止访问),L
表示last
(最后),通常当你希望停止重写操作而立即重定向时,可用L
.htaccess
中用到的正则元字符
元字符^
匹配你要用来查找的字符串的开头元字符$
匹配结尾。
比如一个网站如果要求你填写的QQ号必须为5位到12位数字时,可以使用:^\d{5,12}$
。
介绍
apache
模块mod_rewrite
提供了一个基于正则表达式分析器的重写引擎来实时重写URL请求。 它支持每个完整规则可以拥有不限数量的子规则以及附加条件规则的灵活而且强大的URL操作机制。 此URL操作可以依赖于各种变量,比如服务器变量、环境变量、HTTP头、时间标记
此模块可以操作URL的所有部分(包括路径信息部分),在__服务器级的(httpd.conf
)__和__目录级的(. htaccess
)__配置都有效,还可以生成最终请求字符串。 此重写操作的结果可以是内部子处理,也可以是外部请求的转向,甚至还可以是内部代理处理。
这里着重介绍一下RewriteCond
的规则以及参数说明。RewriteCond
指令定义了规则生效的条件,即在一个RewriteRule
指令之前可以有一个或多个RewriteCond
指令。 条件之后的重写规则仅在当前URI
与Pattern
匹配并且满足此处的条件(TestString
能够与CondPattern
匹配)时才会起作用。
【说明】定义重写发生的条件
【语法】RewriteCond TestString CondPattern [flags]
【作用域】server config, virtual host, directory, .htaccess
【覆盖项】FileInfo
【状态】 扩展(E)
【模块】mod_rewrite
TestString
是一个纯文本的字符串,但是还可以包含下列可扩展的成分:
RewriteRule
反向引用 ,引用方法是:$N (0 <= N <= 9)
引用当前(带有若干RewriteRule
指令的)RewriteCond
中的与Pattern
匹配的捕获分组(圆括号!)。
RewriteCond
反向引用 ,引用方法是:%N (1 <= N <= 9)
引用当前若干RewriteCond
条件中最后符合的条件中的捕获分组(圆括号!)。
RewriteMap
扩展 ,引用方法是:${mapname:key|default}
细节请参见RewriteMap
指令 。
服务器变量 ,引用方法是:%{NAME_OF_VARIABLE}
NAME_OF_VARIABLE
可以是下表列出的字符串之一:
- HTTP头连接与请求
HTTP_USER_AGENT
HTTP_REFERER
HTTP_COOKIE
HTTP_FORWARDED
HTTP_HOST
HTTP_PROXY_CONNECTION
HTTP_ACCEPT REMOTE_ADDR
REMOTE_HOST
REMOTE_PORT
REMOTE_USER
REMOTE_IDENT
REQUEST_METHOD
SCRIPT_FILENAME
PATH_INFO
QUERY_STRING
AUTH_TYPE
- 服务器自身 日期和时间 其它
DOCUMENT_ROOT
SERVER_ADMIN
SERVER_NAME
SERVER_ADDR
SERVER_PORT
SERVER_PROTOCOL
SERVER_SOFTWARE TIME_YEAR
TIME_MON
TIME_DAY
TIME_HOUR
TIME_MIN
TIME_SEC
TIME_WDAY
TIME API_VERSION
THE_REQUEST
REQUEST_URI
REQUEST_FILENAME
IS_SUBREQ
HTTPS
这些变量都对应于类似命名的HTTP MIME
头、Apache
服务器的C变量、Unix系统中的struct tm
字段,其中的大多数在其他的手册或者CGI规范中都有说明。 其中为mod_rewrite
所特有的变量如下:
-
IS_SUBREQ
如果正在处理的请求是一个子请求,它将包含字符串”true”,否则就是”false”。模块为了解析URI中的附加文件,可能会产生子请求。 -
API_VERSION
这是正在使用中的Apache模块API(服务器和模块之间内部接口)的版本,其定义位于include/ap_mmn.h
中。 此模块API版本对应于正在使用的Apache的版本(比如在Apache1.3.14
的发行版中这个值是19990320:10)。 通常,对它感兴趣的是模块的开发者。 -
THE_REQUEST
这是由浏览器发送的完整的HTTP请求行(比如:”GET /index.html HTTP/1.1
″)。 它不包含任何浏览器发送的其它头信息。 -
REQUEST_URI
这是在HTTP请求行中所请求的资源(比如上述例子中的”/index.html
”)。 -
REQUEST_FILENAME
这是与请求相匹配的完整的本地文件系统的文件路径名。 -
HTTPS
如果连接使用了SSL/TLS
,它将包含字符串”on
”,否则就是”off
”(无论mod_ssl
是否已经加载,该变量都可以安全的使用)。
其它注意事项:
SCRIPT_FILENAME
和REQUEST_FILENAME
包含的值是相同的——即Apache服务器内部的request_rec
结构中的filename
字段。
特殊形式:%{ENV:variable}
,其中的variable
可以是任意环境变量。 它是通过查找Apache内部结构或者(如果没找到的话)由Apache服务器进程通过getenv()
得到的。
特殊形式:%{SSL:variable}
,其中的variable
可以是一个SSL
环境变量 的名字,无论mod_ssl
模块是否已经加载都可以使用(未加载时为空字符串)。 比如:%{SSL:SSL_CIPHER_USEKEYSIZE}
将会被替换为128
。
特殊形式:%{HTTP:header}
,其中的header
可以是任意HTTP MIME
头的名称。 它总是可以通过查找HTTP请求而得到。 比如:%{HTTP:Proxy-Connection}
将被替换为Proxy-Connection:HTTP
头的值。
预设形式:%{LA-U:variable}
,variable
的最终值在执行一个内部(基于URL的)子请求后确定。 当需要使用一个目前未知但是会在之后的过程中设置的变量的时候,就可以使用这个方法。 例如,需要在服务器级配置(httpd.conf
文件)中根据REMOTE_USER
变量进行重写, 就必须使用%{LA-U:REMOTE_USER}
。 因为此变量是由URL重写(mod_rewrite
)步骤之后的认证步骤设置的。 但是另一方面,因为mod_rewrite
是通过API修正步骤来实现目录级(.htaccess
文件)配置的, 而认证步骤先于API修正步骤,所以可以用%{REMOTE_USER}
。
预设形式:%{LA-F:variable}
,variable的最终值在执行一个内部(基于文件名的)子请求后确定。 大多数情况下和上述的LA-U
是相同的。
CondPattern
是条件模式,即一个应用于当前TestString
实例的正则表达式。TestString
将被首先计算,然后再与CondPattern
匹配。
注意:CondPattern
是一个perl
兼容的正则表达式,但是还有若干增补:
- 在
CondPattern
串的开头使用’!
’(惊叹号)来指定 不匹配 。 CondPatterns
有若干特殊的变种。 除了正则表达式的标准用法,还有下列用法:
‘<CondPattern
‘ (词典顺序的小于)
将CondPattern
视为纯字符串,与TestString
按词典顺序进行比较。 如果TestString
小于CondPattern
则为真。
‘>CondPattern
‘ (词典顺序的大于)
将CondPattern视为纯字符串,与TestString
按词典顺序进行比较。 如果TestString
大于CondPattern
则为真。
‘=CondPattern
‘ (词典顺序的等于)
将CondPattern视为纯字符串,与TestString
按词典顺序进行比较。 如果TestString
等于CondPattern
(两个字符串逐个字符地完全相等)则为真。 如果CondPattern
是”"(两个双引号),则TestString
将与空字符串进行比较。
‘-d
‘(目录)
将TestString
视为一个路径名并测试它是否为一个存在的目录。
‘-f
‘(常规文件)
将TestString
视为一个路径名并测试它是否为一个存在的常规文件。
‘-s
‘(非空的常规文件)
将TestString
视为一个路径名并测试它是否为一个存在的、尺寸大于0的常规文件。
‘-l
‘(符号连接)
将TestString
视为一个路径名并测试它是否为一个存在的符号连接。
‘-x
‘(可执行)
将TestString
视为一个路径名并测试它是否为一个存在的、具有可执行权限的文件。 该权限由操作系统检测。
‘-F
‘(对子请求存在的文件)
检查TestString
是否为一个有效的文件,而且可以在服务器当前的访问控制配置下被访问。 它使用一个内部子请求来做检查,由于会降低服务器的性能,所以请谨慎使用!
‘-U
‘(对子请求存在的URL)
检查TestString
是否为一个有效的URL,而且可以在服务器当前的访问控制配置下被访问。 它使用一个内部子请求来做检查,由于会降低服务器的性能,所以请谨慎使用!
注意: 所有这些测试都可以用惊叹号作前缀(‘!
’)以实现测试条件的反转。
在CondPattern
之后追加特殊的标记[flags]
作为RewriteCond
指令的第三个参数。flags
是一个以逗号分隔的以下标记的列表:
‘nocase|NC
‘(忽略大小写)
它使测试忽略大小写,扩展后的TestString
和CondPattern
中’AZ
’ 和’a-z
’是没有区别的。 此标记仅用于TestString
和CondPattern
的比较,而对文件系统和子请求的检查不起作用。
‘ornext|OR
‘(或下一条件)
它以OR
方式组合若干规则的条件,而不是隐含的AND
。 典型的例子如下:
RewriteCond %{REMOTE_HOST} ^host1.* [OR]
RewriteCond %{REMOTE_HOST} ^host2.* [OR]
RewriteCond %{REMOTE_HOST} ^host3.*
RewriteRule … # 针对这3个主机的规则集…如果不用[OR]这个标记,你就必须要书写三次条件/规则对。
举例 : 如果要按请求头中的”User-Agent:
”重写一个站点的主页,可以这样写:
RewriteCond % { HTTP_USER_AGENT } ^Mozilla.*
RewriteRule ^/$ /homepage. max .html [ L ]
RewriteCond % { HTTP_USER_AGENT } ^Lynx.*
RewriteRule ^/$ /homepage. min .html [ L ]
RewriteRule ^/$ /homepage .std.html [ L ]
解释:
如果你使用的浏览器的userAgent
是’Mozilla
’,则你将得到内容最大化的主页(含有Frames
等等)。
如果你使用的是(基于终端的)Lynx
, 则你得到的是内容最小化的主页(不含table
等等)。
如果上述条件都不满足(使用的是其他浏览器),则你得到的是一个标准的主页。
RewriteCond
中的$1
参数是做什么的?
我正在设置Apache
重写规则,记录了以下规则(或类似的规则)的使用情况:
RewriteEngine on
RewriteCond $1 !^(index\.php|phpinfo\.php|images|robots\.txt|sitemap\.xml\.gz|sitemap\.xml|assets)
RewriteRule ^(.*)$ /index.php/$1 [L]
我知道RewriteRule
之后的$1
引用了从(.*)
捕获的字符串。,但是第一个$1
(直接在RewriteCond
之后)代表什么?我见过的很多例子都使用了%{REQUEST_URI}
作为RewriteCond
的第一个参数。
答:$1
基本上是从字符串的开头和结尾捕获的所有内容。换句话说,$1 = (.*)
。
在你的重写中,^
表示字符串的开始,(.*)
说要匹配任何东西,而$
表示字符串的结束。因此,基本上,它意味着从字符串开始到结束的所有内容,并将该值赋值为$1
。
所以如果我输入www.example.com/tacos-are-good
然后,$1 = "tacos-are-good"
。所以你的最终重写将是www.example.com/index.php/tacos-are-good
。
标签:RewriteRule,HTTP,index,TestString,htaccess,CondPattern,RewriteCond 来源: https://blog.csdn.net/WuLex/article/details/110081059