您好,登錄后才能下訂單哦!
這期內容當中小編將會給大家帶來有關nginx 中怎么實現正則匹配,文章內容豐富且以專業的角度為大家分析和敘述,閱讀完這篇文章希望大家可以有所收獲。
今天遇到網站之前的url被百度搜索引擎抓取,需要在服務中進行301強制跳轉,(如訪問:www.baidu.com/kenni-1,www.baidu.com/kenni-1/,兩個統一跳轉到www.baidu.com/kenni-1.html,以及www.baidu.com/kenni-1?page=11,跳轉到www.baidu.com/kenni-1.html?page=11,kenni-后面接數字)
因為服務器使用的是nginx,所以在nginx增加如下配置:
# 訪問 域名/kenni-10 跳轉到域名 域名/kenni-10.html
rewrite ^/kenni-([0-9]+)$ /kenni-$1.html permanent;
# 訪問 域名/kenni-10/ 跳轉到域名 域名/kenni-10.html
rewrite ^/kenni-([0-9]+)/$ /kenni-$1.html permanent;
其他學習參考資料:
1、^: 匹配字符串的開始位置;
2、 $:匹配字符串的結束位置;
3、.*: .匹配任意字符,*匹配數量0到正無窮;
4、\. 斜杠用來轉義,\.匹配 . 特殊使用方法,記住記性了;
5、(值1|值2|值3|值4):或匹配模式,例:(jpg|gif|png|bmp)匹配jpg或gif或png或bmp
6、i不區分大小寫
一.正則表達式匹配,其中:
* ~ 為區分大小寫匹配
* ~* 為不區分大小寫匹配
* !~和!~*分別為區分大小寫不匹配及不區分大小寫不匹配
二.文件及目錄匹配,其中:
* -f和!-f用來判斷是否存在文件
* -d和!-d用來判斷是否存在目錄
* -e和!-e用來判斷是否存在文件或目錄
* -x和!-x用來判斷文件是否可執行
三.rewrite指令的最后一項參數為flag標記,flag標記有:
1.last 相當于apache里面的[L]標記,表示rewrite。
2.break本條規則匹配完成后,終止匹配,不再匹配后面的規則。
3.redirect 返回302臨時重定向,瀏覽器地址會顯示跳轉后的URL地址。
4.permanent 返回301永久重定向,瀏覽器地址會顯示跳轉后的URL地址。
使用last和break實現URI重寫,瀏覽器地址欄不變。而且兩者有細微差別,使用alias指令必須用last標記;使用proxy_pass指令時,需要使用break標記。Last標記在本條rewrite規則執行完畢后,會對其所在server{......}標簽重新發起請求,而break標記則在本條規則匹配完成后,終止匹配。
例如:如果我們將類似URL/photo/123456 重定向到/path/to/photo/12/1234/123456.png
rewrite "/photo/([0-9]{2})([0-9]{2})([0-9]{2})"/path/to/photo/$1/$1$2/$1$2$3.png ;
四.NginxRewrite 規則相關指令
1.break指令
使用環境:server,location,if;
該指令的作用是完成當前的規則集,不再處理rewrite指令。
2.if指令
使用環境:server,location
該指令用于檢查一個條件是否符合,如果條件符合,則執行大括號內的語句。If指令不支持嵌套,不支持多個條件&&和||處理。
3.return指令
語法:returncode ;
使用環境:server,location,if;
該指令用于結束規則的執行并返回狀態碼給客戶端。
示例:如果訪問的URL以".sh"或".bash"結尾,則返回403狀態碼
location ~ .*\.(sh|bash)?$
{
return 403;
}
4.rewrite 指令
語法:rewriteregex replacement flag
使用環境:server,location,if
該指令根據表達式來重定向URI,或者修改字符串。指令根據配置文件中的順序來執行。注意重寫表達式只對相對路徑有效。如果你想配對主機名,你應該使用if語句,示例如下:
if( $host ~* www\.(.*) )
{
set $host_without_www $1;
rewrite ^(.*)$ http://$host_without_www$1permanent;
}
5.Set指令
語法:setvariable value ; 默認值:none; 使用環境:server,location,if;
該指令用于定義一個變量,并給變量賦值。變量的值可以為文本、變量以及文本變量的聯合。
示例:set$varname "hello world";
6.Uninitialized_variable_warn指令
語法:uninitialized_variable_warnon|off
使用環境:http,server,location,if
該指令用于開啟和關閉未初始化變量的警告信息,默認值為開啟。
五.Nginx的Rewrite規則編寫實例
1.當訪問的文件和目錄不存在時,重定向到某個php文件
if( !-e $request_filename )
{
rewrite ^/(.*)$ index.php last;
}
2.目錄對換 /123456/xxxx ====> /xxxx?id=123456
rewrite ^/(\d+)/(.+)/ /$2?id=$1 last;
3.如果客戶端使用的是IE瀏覽器,則重定向到/ie目錄下
if( $http_user_agent ~ MSIE)
{
rewrite ^(.*)$ /ie/$1 break;
}
4.禁止訪問多個目錄
location ~ ^/(cron|templates)/
{
deny all;
break;
}
5.禁止訪問以/data開頭的文件
location ~ ^/data
{
deny all;
}
6.禁止訪問以.sh,.flv,.mp3為文件后綴名的文件
location ~ .*\.(sh|flv|mp3)$
{
return 403;
}
7.設置某些類型文件的瀏覽器緩存時間
location ~ .*\.(gif|jpg|jpeg|png|bmp|swf)$
{
expires 30d;
}
location ~ .*\.(js|css)$
{
expires 1h;
}
8.給favicon.ico和robots.txt設置過期時間;
這里為favicon.ico為99天,robots.txt為7天并不記錄404錯誤日志
location ~(favicon.ico) {
log_not_found off;
expires 99d;
break;
}
location ~(robots.txt) {
log_not_found off;
expires 7d;
break;
}
9.設定某個文件的過期時間;這里為600秒,并不記錄訪問日志
location ^~ /html/scripts/loadhead_1.js {
access_log off;
root /opt/lampp/htdocs/web;
expires 600;
break;
}
10.文件反盜鏈并設置過期時間
這里的return412 為自定義的http狀態碼,默認為403,方便找出正確的盜鏈的請求
“rewrite ^/ https://cache.yisu.com/upload/information/20210524/347/788800.gif;”顯示一張防盜鏈圖片
“access_log off;”不記錄訪問日志,減輕壓力
“expires 3d”所有文件3天的瀏覽器緩存
location ~*^.+\.(jpg|jpeg|gif|png|swf|rar|zip|css|js)$ {
valid_referers none blocked *.linuxidc.com*.linuxidc.net localhost 208.97.167.194;
if ($invalid_referer) {
rewrite ^/ https://cache.yisu.com/upload/information/20210524/347/788800.gif;
return 412;
break;
}
access_log off;
root /opt/lampp/htdocs/web;
expires 3d;
break;
}
11.只允許固定ip訪問網站,并加上密碼
root /opt/htdocs/www;
allow 208.97.167.194;
allow 222.33.1.2;
allow 231.152.49.4;
deny all;
auth_basic “C1G_ADMIN”;
auth_basic_user_file htpasswd;
12將多級目錄下的文件轉成一個文件,增強seo效果
/job-123-456-789.html 指向/job/123/456/789.html
rewrite^/job-([0-9]+)-([0-9]+)-([0-9]+)\.html$ /job/$1/$2/jobshow_$3.html last;
13.文件和目錄不存在的時候重定向:
if (!-e $request_filename) {
proxy_pass http://127.0.0.1;
}
14.將根目錄下某個文件夾指向2級目錄
如/shanghaijob/ 指向 /area/shanghai/
如果你將last改成permanent,那么瀏覽器地址欄顯是/location/shanghai/
rewrite ^/([0-9a-z]+)job/(.*)$ /area/$1/$2last;
上面例子有個問題是訪問/shanghai時將不會匹配
rewrite ^/([0-9a-z]+)job$ /area/$1/ last;
rewrite ^/([0-9a-z]+)job/(.*)$ /area/$1/$2last;
這樣/shanghai 也可以訪問了,但頁面中的相對鏈接無法使用,
如./list_1.html真實地址是/area/shanghia/list_1.html會變成/list_1.html,導至無法訪問。
那我加上自動跳轉也是不行咯
(-d $request_filename)它有個條件是必需為真實目錄,而我的rewrite不是的,所以沒有效果
if (-d $request_filename){
rewrite ^/(.*)([^/])$ http://$host/$1$2/permanent;
}
知道原因后就好辦了,讓我手動跳轉吧
rewrite ^/([0-9a-z]+)job$ /$1job/permanent;
rewrite ^/([0-9a-z]+)job/(.*)$ /area/$1/$2last;
15.域名跳轉
server
{
listen 80;
server_name jump.linuxidc.com;
index index.html index.htm index.php;
root /opt/lampp/htdocs/www;
rewrite ^/ http://www.linuxidc.com/;
access_log off;
}
16.多域名轉向
server_name www.linuxidc.comwww.linuxidc.net;
index index.html index.htm index.php;
root /opt/lampp/htdocs;
if ($host ~ "linuxidc\.net") {
rewrite ^(.*) http://www.linuxidc.com$1permanent;
}
六.nginx全局變量
arg_PARAMETER #這個變量包含GET請求中,如果有變量PARAMETER時的值。
args #這個變量等于請求行中(GET請求)的參數,如:foo=123&bar=blahblah;
binary_remote_addr #二進制的客戶地址。
body_bytes_sent #響應時送出的body字節數數量。即使連接中斷,這個數據也是精確的。
content_length #請求頭中的Content-length字段。
content_type #請求頭中的Content-Type字段。
cookie_COOKIE #cookie COOKIE變量的值
document_root #當前請求在root指令中指定的值。
document_uri #與uri相同。
host #請求主機頭字段,否則為服務器名稱。
hostname #Set to themachine’s hostname as returned by gethostname
http_HEADER
is_args #如果有args參數,這個變量等于”?”,否則等于”",空值。
http_user_agent #客戶端agent信息
http_cookie #客戶端cookie信息
limit_rate #這個變量可以限制連接速率。
query_string #與args相同。
request_body_file #客戶端請求主體信息的臨時文件名。
request_method #客戶端請求的動作,通常為GET或POST。
remote_addr #客戶端的IP地址。
remote_port #客戶端的端口。
remote_user #已經經過Auth Basic Module驗證的用戶名。
request_completion #如果請求結束,設置為OK. 當請求未結束或如果該請求不是請求鏈串的最后一個時,為空(Empty)。
request_method #GET或POST
request_filename #當前請求的文件路徑,由root或alias指令與URI請求生成。
request_uri #包含請求參數的原始URI,不包含主機名,如:”/foo/bar.php?arg=baz”。不能修改。
scheme #HTTP方法(如http,https)。
server_protocol #請求使用的協議,通常是HTTP/1.0或HTTP/1.1。
server_addr #服務器地址,在完成一次系統調用后可以確定這個值。
server_name #服務器名稱。
server_port #請求到達服務器的端口號。
七.Apache和Nginx規則的對應關系
Apache的RewriteCond對應Nginx的if
Apache的RewriteRule對應Nginx的rewrite
Apache的[R]對應Nginx的redirect
Apache的[P]對應Nginx的last
Apache的[R,L]對應Nginx的redirect
Apache的[P,L]對應Nginx的last
Apache的[PT,L]對應Nginx的last
例如:允許指定的域名訪問本站,其他的域名一律轉向www.linuxidc.net
Apache:
RewriteCond %{HTTP_HOST} !^(.*?)\.aaa\.com$[NC]
RewriteCond %{HTTP_HOST} !^localhost$
RewriteCond %{HTTP_HOST}!^192\.168\.0\.(.*?)$
RewriteRule ^/(.*)$ http://www.linuxidc.net[R,L]
Nginx:
if( $host ~* ^(.*)\.aaa\.com$ )
{
set $allowHost ‘1’;
}
if( $host ~* ^localhost )
{
set $allowHost ‘1’;
}
if( $host ~* ^192\.168\.1\.(.*?)$ )
{
set $allowHost ‘1’;
}
if( $allowHost !~ ‘1’ )
{
rewrite ^/(.*)$ http://www.linuxidc.netredirect ;
}
上述就是小編為大家分享的nginx 中怎么實現正則匹配了,如果剛好有類似的疑惑,不妨參照上述分析進行理解。如果想知道更多相關知識,歡迎關注億速云行業資訊頻道。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。