91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

golang中怎么抓取網頁并分析頁面包含的鏈接

發布時間:2021-07-06 15:44:52 來源:億速云 閱讀:427 作者:Leah 欄目:編程語言

golang中怎么抓取網頁并分析頁面包含的鏈接,相信很多沒有經驗的人對此束手無策,為此本文總結了問題出現的原因和解決方法,通過這篇文章希望你能解決這個問題。

1. 下載非標準的包,"golang.org/x/net/html"

2. 先安裝git,使用git命令下載

git clone https://github.com/golang/net

3. 將net包,放到GOROOT路徑下

比如:

我的是:GOROOT = E:\go\

所以最終目錄是:E:\go\src\golang.org\x\net

注意:如果沒有golang.org和x文件夾,就創建

4. 創建fetch目錄,在其下創建main.go文件,main.go文件代碼內容如下:

package main
 
import (
 "os"
 "net/http"
 "fmt"
 "io/ioutil"
)
 
func main() {
 for _, url := range os.Args[1:] {
 resp, err := http.Get(url)
 if err != nil {
  fmt.Fprintf(os.Stderr, "fetch: %v\n", err)
 }
 b, err := ioutil.ReadAll(resp.Body)
 resp.Body.Close()
 if err != nil {
  fmt.Fprintf(os.Stderr, "fetch: reading %s: %v\n", url, err)
  os.Exit(1)
 }
 fmt.Printf("%s",b)
 }
}

5. 編譯fetch

go build test.com\justin\demo\fetch

注意:test.com\justin\demo\ 是我的項目路徑,具體編譯根據自己項目路徑編譯。

6. 執行fetch.exe 文件

fetch.exe https://www.qq.com

注意:https://www.qq.com是要爬的網址,配置正確的話,會打印出網址的HTML內容。如果沒有,請檢查以上步驟是否正確。

7. 網頁已經抓取了,那么剩下就分析頁面包含的鏈接了,創建findlinks目錄,在其下創建main.go文件,main.go文件代碼內容如下:

package main
 
import (
 "os"
 "fmt"
 "golang.org/x/net/html"
)
 
func main() {
 doc, err := html.Parse(os.Stdin)
 if err != nil {
 fmt.Fprint(os.Stderr, "findlinks: %v\n", err)
 os.Exit(1)
 }
 for _, link := range visit(nil, doc) {
 fmt.Println(link)
 }
}
 
func visit(links []string, n *html.Node) []string {
 if n.Type == html.ElementNode && n.Data == "a" {
 for _, a := range n.Attr {
  if a.Key == "href" {
  links = append(links, a.Val)
  }
 }
 }
 for c := n.FirstChild; c != nil; c = c.NextSibling {
 links = visit(links, c)
 }
 return links
}

8. 編譯findlinks

go build test.com\justin\demo\findlinks

注意:test.com\justin\demo\ 是我的項目路徑,具體編譯根據自己項目路徑編譯。

9. 執行findlinks.exe 文件

fetch.exe https://www.qq.com | findlinks.exe

> 10. 執行后結果:獲取到各種不同形式的超鏈接

看完上述內容,你們掌握golang中怎么抓取網頁并分析頁面包含的鏈接的方法了嗎?如果還想學到更多技能或想了解更多相關內容,歡迎關注億速云行業資訊頻道,感謝各位的閱讀!

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

尼勒克县| 五原县| 开平市| 温泉县| 海原县| 泾川县| 卫辉市| 运城市| 南宁市| 邢台市| 京山县| 西乡县| 休宁县| 湘潭市| 水城县| 伊吾县| 游戏| 张家港市| 贵定县| 兴仁县| 遵义县| 永宁县| 黄陵县| 长顺县| 雅安市| 虞城县| 嘉定区| 句容市| 江城| 屯昌县| 千阳县| 盐津县| 永城市| 阿坝| 年辖:市辖区| 东乡县| 洪洞县| 浪卡子县| 光泽县| 汤原县| 比如县|