您好,登錄后才能下訂單哦!
本篇內容主要講解“jquery怎么爬取頁面數據”,感興趣的朋友不妨來看看。本文介紹的方法操作簡單快捷,實用性強。下面就讓小編來帶大家學習“jquery怎么爬取頁面數據”吧!
搭建環境:
(1)、創建一個文件夾,進入并初始化一個package.json文件。
npm init -y
(2)、安裝相關依賴:
npm install --save koa? ? npm install --save cheerio //后面會用到,用于抓取頁面模塊,為服務器特別定制的,快速、靈活、實施的jQuery核心實現
現在來一個簡單的demo熱熱身。直接上代碼(文件名:demo2.js):
var http=require('http') // Node.js提供了http模塊,用于搭建HTTP服務端和客戶端
var url='' //輸入任何網址都可以
http.get(url,function(res){ //發送get請求
var html=''
res.on('data',function(data){
html +=data //字符串的拼接
})
res.on('end',function(){
console.log(html)
})
})。on('error',function(){
console.log('獲取資源出錯!')
})
執行node demo2.js? ?得到結果如下:
很神奇有木有。然而這不是我們想要的,我們想要的是獲取頁面里面某一部份的數據。
這里以 沒事影院 的電視劇頁面為例。這時候cheerio就派上用場了,前面已經安裝過,這里就不再贅述,它的用法其實跟jquery是很相似的。參考?cheerio(百度百科的解釋)
在剛剛的js文件中引入cheerio模塊,然后加載所需要的html內容。
var $=cheerio.load(html)? // 加載需要的html
為了方便使用,這里封裝一個函數:
functionfilterChapters(html) {var $=cheerio.load(html) //加載需要的html,然后就可以愉快地使用類似jQuery的語法了
var chapters=$('.movie-item') //在html里尋找需要的資源的class
var courseData=[] //創建一個數組,用來保存資源
chapters.each(function(item, index) { //遍歷我們的html文檔
到此,相信大家對“jquery怎么爬取頁面數據”有了更深的了解,不妨來實際操作一番吧!這里是億速云網站,更多相關內容可以進入相關頻道進行查詢,關注我們,繼續學習!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。