91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

Go語言如何實現并發爬蟲

發布時間:2021-12-14 12:23:41 來源:億速云 閱讀:243 作者:小新 欄目:開發技術

這篇文章將為大家詳細講解有關Go語言如何實現并發爬蟲,小編覺得挺實用的,因此分享給大家做個參考,希望大家閱讀完這篇文章后可以有所收獲。

1. 單線程爬蟲

 定義一個用戶

var Client http.Client

主函數

func main() {
	url := "http://localhost:3000/api/v1/products"
	start := time.Now()
	for i := 0; i < 10; i++ {
		Spider(url, i)
	}
	elapsed := time.Since(start)
	fmt.Printf("Time %s", elapsed)
}

爬取函數

func Spider(url string, i int) {
	reqSpider, err := http.NewRequest("GET", url, nil)
	if err != nil {
		log.Fatal(err)
	}
	reqSpider.Header.Set("content-length", "0")
	reqSpider.Header.Set("accept", "*/*")
	reqSpider.Header.Set("x-requested-with", "XMLHttpRequest")
	respSpider, err := Client.Do(reqSpider)
	if err != nil {
		log.Fatal(err)
	}
	bodyText, _ := ioutil.ReadAll(respSpider.Body)
	var result Result
	_ = json.Unmarshal(bodyText, &result)
	fmt.Println(i,result.Data)
}

運行時間為:651.8207ms

Go語言如何實現并發爬蟲

2. 多線程爬蟲

2.1 channel main函數

我們構造一個無緩沖的通道,來阻塞主進程,等待子進程的執行。

func main() {
	url := "http://localhost:3000/api/v1/products"
	ch := make(chan bool)
	start := time.Now()
	for i := 0; i < 10; i++ {
		go Spider(url, ch, i)
	}
	for i := 0; i < 10; i++ {
		<-ch
	}
	elapsed := time.Since(start)
	fmt.Printf("Time %s", elapsed)
}

最后記得在爬蟲的結束的時候,把值寫入到通道中,不然會一直阻塞主進程

Go語言如何實現并發爬蟲

運行時間:187.7921ms 比之前快了非常多。

Go語言如何實現并發爬蟲

2.2 sync.WaitGroup

定義一個進程組并加10個進程

	var wg sync.WaitGroup
	wg.Add(10)

開辟十個goruntime

	for i := 0; i < 10; i++ {
		go func(i int) {
			defer wg.Done()
			SpiderWaitGroup(url,i)
		}(i)
	}

阻塞主進程

wg.Wait()

結果:64.5246ms

Go語言如何實現并發爬蟲

3. 源碼地址

GitHub地址:https://github.com/CocaineCong/Go-Spider-Demo

	NormalStart(url) // 單線程爬蟲
	ChannelStart(url) // Channel多線程爬蟲
	WaitGroupStart(url) // Wait 多線程爬蟲

其實多線程的兩種都差不多的,只是有時候會因為機器的原因而導致一些誤差。

Go語言如何實現并發爬蟲

關于“Go語言如何實現并發爬蟲”這篇文章就分享到這里了,希望以上內容可以對大家有一定的幫助,使各位可以學到更多知識,如果覺得文章不錯,請把它分享出去讓更多的人看到。

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

收藏| 三明市| 宁蒗| 大埔区| 平安县| 宜城市| 广安市| 瑞金市| 五寨县| 曲麻莱县| 临桂县| 体育| 塔河县| 思茅市| 太和县| 长沙市| 拉萨市| 宜兰市| 长岛县| 襄樊市| 东阿县| 明水县| 大洼县| 齐齐哈尔市| 青浦区| 温州市| 甘孜| 华宁县| 邵阳市| 蒙城县| 图们市| 郸城县| 锡林浩特市| 和林格尔县| 伊吾县| 遂昌县| 津南区| 老河口市| 龙胜| 沛县| 岳西县|