您好,登錄后才能下訂單哦!
本篇內容主要講解“JavaScript是怎么驗證URL的”,感興趣的朋友不妨來看看。本文介紹的方法操作簡單快捷,實用性強。下面就讓小編來帶大家學習“JavaScript是怎么驗證URL的”吧!
URL驗證的存在是為了加強安全,防止可能存在的漏洞,并消除運行代碼時產生的任何錯誤的機會。但是我們應該在什么時候使用URL驗證,在這個過程中我們要驗證什么呢?我們應該在所有必須識別和驗證諸如網頁、圖片、gif和視頻等資源的軟件中實施URL驗證。
一個典型的URL包括多個片段,比如協議、域名、主機名、資源名、URL源、端口等等。這些用來告訴瀏覽器如何追蹤指定的資源。我們可以以不同的方式來驗證URL:
使用正則字面量和構造函數
URL構造函數
isValidURL
方法
Input元素
Anchor標簽方法
一個典型的URL驗證方案接收來自用戶的輸入,然后對其進行解析,以識別其各個組成部分。驗證方案可以確保所有的URL組件符合互聯網標準。例如,如果需要,它可以檢查URL是否使用安全協議。
主機名驗證首先是將主機名分成獨立的標簽,以確保它們符合頂級域名規范。一個典型的主機名由至少兩個用點分隔的標簽組成。例如,www.snyk.com 有 "www"、"snyk"和 "com"的標簽。每個標簽只能由一個字母數字字符或一個連字符組成,無論大小寫。然后,驗證方案可以確保主機名與URL的允許列表相匹配,以確保只允許指定的URL,并且允許的URL不會被錯誤地取消資格。
默認情況下,URL中使用的大多數資源的路徑都是允許的。然而,端口只能在1到65536的范圍內。任何超出這個范圍的東西都應該拋出一個錯誤。我們還可以檢查數字IP地址,以判斷它是一個IPV4地址還是IPV6地址。
最后,我們也可以檢查URL的用戶名和密碼。這個功能有助于遵守公司政策和憑證保護。
現在,你已經有了這些基礎知識,讓我們來看看使用javascript的URL驗證吧。
在JavaScript中,執行URL驗證最簡單的方式是使用new URL
構造函數。除此之外,它還得到了Node.js運行時和大多數瀏覽器的支持。
基本語法如下:
new URL (url) new URL (url , base)
如果提供相對URL,JavaScript只需要base
元素。如果不提供相對URL,默認為undefined
。另外,如果提供一個具有絕對URL的base
元素,JavaScript會忽略base
元素。
為了驗證URL,可以使用以下代碼:
function checkUrl (string) { let givenURL ; try { givenURL = new URL (string); } catch (error) { console.log ("error is", error); return false; } return true; }
該函數用于檢查URL的有效性。當URL有效時返回true
,否則返回false
。
如果你傳遞www.urlcheck.com
給該函數會返回false
。因為該參數并不是一個有效的URL。正確版本應該是https://urlcheck.com
。
另一個例子是mailto:John.Doe@example.com
。這是一個有效的URL,但如果移除了冒號,JavaScript就不再認為它是一個URL了。
第三個例子是ftp://
。這不是一個有效URL,因為沒有包含主機名。如果你添加兩個點(..
),就會變成有效URL。因為點會被認為是一個主機名,也就是說ftp://..
變成了一個有效的URL。
重要的是要記住,非常規的、但完全有效的URL是存在的!它們可能對從事這些工作的開發人員來說是意外的,但在其他方面是完全合適的。例如,以下兩個URL都會返回真值:
new URL("youtube://a.b.c.d");
new URL("a://1.2.3.4@1.2.3.4");
這些例子提醒我們,開發者應該依靠URL驗證原則,而不是專注于慣例。
如果你想確保有效的URL包含一些特定的URL方案,你可以使用以下函數:
function checkHttpUrl(string) { let givenURL; try { givenURL = new URL(string); } catch (error) { console.log("error is",error) return false; } return givenURL.protocol === "http:" || givenURL.protocol === "https:"; }
該函數驗證URL,然后檢查URL是否使用HTTP或者HTTPS。在這里,ftp://..
會被認為是無效的,因為它不包含HTTP或者HTTPS,而http://..
依舊有效。
使用URL
構造函數的一些其他方式包括:
let m = '<https://snyk.io>'; let a = new URL("/", m);
上述示例使用了base
元素。記錄下這個值,我們就可以得到https://snyk.io/
。
要返回一個URL對象而不指定base
參數的話,語法是:
let b = new URL(m);
為了給主機添加一個路徑名,我們的代碼結構如下:
let d = new URL('/en-US/docs', b);
存儲在變量d
上的URL是https://snyk.io/en-US/docs
。
URL模塊的另一個功能是,它實現了WHATWG URL API,它遵守WHATWG的URL標準,供瀏覽器使用:
let adr = new URL("<https://snyk.io/en-US/docs>"); let host = adr.host; let path = adr.pathname;
在上面的例子中,我們創建了一個名為adr
的URL對象。接著,代碼獲取URL的主機和路徑名,分別是snyk.io
和/en-US/docs
。最后,我們可以將URL和允許列表或者黑名單進行對比,確保只有特定URL是被允許的。
另一種驗證URL的方法是使用正則表達式(regex)。我們可以使用Regex來檢查URL是否有效。
使用regex進行URL驗證的JavaScript語法是:
function isValidURL(string) { var res = string.match(/(https?:\/\/(?:www\.|(?!www))[a-zA-Z0-9][a-zA-Z0-9- ]+[a-zA-Z0-9]\.[^\s]{2,}|www\.[a-zA-Z0-9][a-zA-Z0-9-]+[a-zA-Z0-9] \.[^\s]{2,}|https?:\/\/(?:www\.|(?!www))[a-zA-Z0-9]+\.[^\s]{2,}|w ww\.[a-zA-Z0-9]+\.[^\s]{2,})/gi); return (res !== null); };
來測試一些URL:
var tc1 = "<http://helloworld.com>" console.log(isValidURL(tc1));
regex定義的URL語法檢查URL是否以http://
或https://
或子域開始,以及是否包含域名。控制臺上的語句結果是true
,因為它遵循了由regex定義的URL語法。相反,下面的語句將返回一個false
,因為它沒有以任何允許的方案或子域開始,也不包含域名:
var tc4 = "helloWorld"; console.log (isValidURL(tc4));
上面的正則表達式相對簡單,但仍然難以駕馭。這也是一個容易出錯的方法,因為一個正則表達式不能充分處理驗證URL的規則。它最多只能做到匹配有效的URL。此外,當一個正則表達式要么包含復雜的驗證邏輯,要么收到冗長的輸入字符串時,執行驗證檢查就變得很耗時。
為了滿足定義的正則表達式驗證檢查,瀏覽器必須在輸入字符串中進行數以百萬計的回溯。如此多的回溯檢查可能會導致"災難性的回溯",這種現象是復雜的正則表達式會凍結瀏覽器或使CPU核心進程爆滿。
正如SSRF被添加到新的OWASP Top 10中所證明的那樣,URL驗證對于JavaScript應用程序的安全性已經變得越來越關鍵。幸運的是,我們可以通過在服務器端驗證URL來幫助緩解此類攻擊。此外,根據驗證和處理URL的首選方式來使用new URL
函數會非常有益。
在看到new URL
函數的一些使用案例后,我們學習了如何用正則表達式驗證一個URL--并看到了為什么這種方法很麻煩而且容易出錯。
URL的安全風險與其說是關于其有效性,不如說是關于危險的URL方案。因此,我們需要確保讓服務器端的應用程序進行驗證。攻擊者可以繞過客戶端的驗證機制,所以僅僅依靠它并不是解決辦法。
到此,相信大家對“JavaScript是怎么驗證URL的”有了更深的了解,不妨來實際操作一番吧!這里是億速云網站,更多相關內容可以進入相關頻道進行查詢,關注我們,繼續學習!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。