91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

如何基于node.js實現爬蟲

發布時間:2021-04-20 09:46:53 來源:億速云 閱讀:136 作者:小新 欄目:web開發

小編給大家分享一下如何基于node.js實現爬蟲,相信大部分人都還不怎么了解,因此分享這篇文章給大家參考一下,希望大家閱讀完這篇文章后大有收獲,下面讓我們一起去了解一下吧!

js有什么特點

1、js屬于一種解釋性腳本語言;2、在絕大多數瀏覽器的支持下,js可以在多種平臺下運行,擁有著跨平臺特性;3、js屬于一種弱類型腳本語言,對使用的數據類型未做出嚴格的要求,能夠進行類型轉換,簡單又容易上手;4、js語言安全性高,只能通過瀏覽器實現信息瀏覽或動態交互,從而有效地防止數據的丟失;5、基于對象的腳本語言,js不僅可以創建對象,也能使用現有的對象。

1. cheerio 與 request

  • request:模擬客戶端行為,對頁面進行請求

  • cheerio:對服務器端返回的頁面進行解析;

var cheerio = require('cheerio');
var request = require('request');
var startUrl = 'http://www.baidu.com'
request(startUrl, function(err, response) {
  if (err) {
    console.log(err);
  }
  var $ = cheerio.load(response.body);
  var title = $('title').text();
  console.log(title);
}

2. 認識 cheerio

獲取 element 位置

通過 class 屬性進行匹配:

var $=cheerio.load('<div class="container"></div>'); 
$('.container')

取其鏈接:<a class="downbtn" href="http://mov.bn.netease.com/mobilev/2013/1/F/G/S8KTEF7FG.mp4" id="M8KTEKR84" target="_blank"></a>

$('a.downbtn').attr('href')

某一頁面下的全部可鏈接:

var url = 
var $ = cheerio.load(data);
  $("a.downbtn").each(function(i, e) {
    console.log($(e).attr("href"));
  });
  console.log("done");
 } else {
   console.log("error");
 }

以上是“如何基于node.js實現爬蟲”這篇文章的所有內容,感謝各位的閱讀!相信大家都有了一定的了解,希望分享的內容對大家有所幫助,如果還想學習更多知識,歡迎關注億速云行業資訊頻道!

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

河源市| 华亭县| 蛟河市| 酉阳| 江都市| 凤凰县| 囊谦县| 两当县| 会东县| 曲松县| 玉溪市| 孝感市| 辽阳县| 大姚县| 饶河县| 越西县| 白朗县| 综艺| 呼伦贝尔市| 婺源县| 庄浪县| 隆尧县| 上栗县| 青阳县| 郑州市| 闽清县| 大庆市| 凤山市| 通渭县| 绵阳市| 宜都市| 长海县| 临猗县| 凤冈县| 洮南市| 开化县| 民乐县| 新密市| 喀什市| 平定县| 潮安县|