您好,登錄后才能下訂單哦!
本篇內容介紹了“Jsoup怎么將相對路徑轉為絕對路徑”的有關知識,在實際案例的操作過程中,不少人都會遇到這樣的困境,接下來就讓小編帶領大家學習一下如何處理這些情況吧!希望大家仔細閱讀,能夠學有所成!
如果想要通過 attr 方法獲取到絕對路徑,必須同時使用這兩個方法。
Document org.jsoup.Jsoup.parse(String html, String baseUri); String org.jsoup.nodes.Node.attr(String attributeKey);
必須使用Jsoup 帶有 baseUri 參數的重載方法,如果只是用具有第一個參數的 方法,那么通過attr取絕對路徑時,獲取的內容為空!這是一個坑,但是其它人的博客都沒有介紹這一點。
Parameters:
html HTML to parse
baseUri The URL where the HTML was
retrieved from. Used to resolve relative URLs to absolute URLs, that
occurbefore the HTML declares a <base href> tag.
這里列出參數的注釋,第一個參數是需要解析的html文檔,第二個參數是這個html的url。用于將相對url解析為絕對url,即在HTML聲明標記之前發生。
注意: 這里的 baseUri 并不是網站的根路徑,它是指當前的html路徑。即當前相對路徑所在的html文檔的路徑,是相對路徑相對的那個路徑。 所以,如果填寫的是當前根路徑,那么最后獲取的絕對路徑也是有問題的。(也許是可以使用的,但是格式可能有問題。) 下面第二點,依賴于當前這個給定的 baseUri 參數。
attr 方法里面的一句話:
To get an absolute URL from an attribute that may be a relative URL, prefix the key with abs,which is a shortcut to the absUrl method.
E.g.: String url = a.attr(“abs:href”);
這句話的意思是從一個相對路徑種獲取一個絕對路徑,使用 abs 前綴,這是absUrl方法的快捷方式。
并且給了一個示例:
String url = a.attr("abs:href");
所以,如果想要獲取到絕對路徑的話,需要在參數前面加上 abs:
。 這里 abs 就是 absolute 的縮寫,它的意思就是絕對的。
但是,如果不去使用帶有上面第一點提到的那個重載的 parse 方法的話,這種方法是取不到絕對路徑的,甚至是取不到路徑。我在這里踩了一個坑。
這里以一個簡單的例子說明: 代碼:
package ahnu.news; import org.jsoup.Jsoup; import org.jsoup.nodes.Document; import org.jsoup.nodes.Element; public class JsoupPathTest { public static void main(String[] args) { String html = "<html>" + "<head></head>" + "<body>" + "<a href=\"../dragon/love/you\"></a>" + "</body>" + "</html>"; System.out.println("正確的用法"); Document doc = Jsoup.parse(html, "http://example/index/loveyou/"); Element aTag = doc.getElementsByTag("a").first(); //獲取 a 標簽,只有一個,取第一個即可。 System.out.println(aTag); String relativePath = aTag.attr("href"); //獲取相對路徑 String absolutePath = aTag.attr("abs:href"); //獲取絕對路徑 System.out.println("相對路徑:" + relativePath); System.out.println("絕對路徑:" + absolutePath); System.out.println("---------------------分割線---------------------"); System.out.println("錯誤的用法"); doc = Jsoup.parse(html); aTag = doc.getElementsByTag("a").first(); //獲取 a 標簽,只有一個,取第一個即可。 System.out.println(aTag); relativePath = aTag.attr("href"); //獲取相對路徑 absolutePath = aTag.attr("abs:href"); //獲取絕對路徑 System.out.println("相對路徑:" + relativePath); System.out.println("絕對路徑:" + absolutePath); } }
運行結果:
注意: 1.在解析html的時候,必須添加 baseUri 參數,否則獲取絕對路徑時,反而什么都得不到,這是一個坑,注意防范。 2.希望其他人貼方法的時候,可以附帶代碼的執行結果,或者如果是轉載的別人的博客,也可以運行一下代碼,不然如果他錯了,你也轉載,那就是在傳播錯誤了。 3.英語還是很重要的,關鍵時候可以幫助自己理解api的正確用法。
“Jsoup怎么將相對路徑轉為絕對路徑”的內容就介紹到這里了,感謝大家的閱讀。如果想了解更多行業相關的知識可以關注億速云網站,小編將為大家輸出更多高質量的實用文章!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。