91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

nodejs單頁面爬蟲(二)--解決編碼問題

發布時間:2020-06-15 23:00:04 來源:網絡 閱讀:555 作者:qmkkd 欄目:開發技術

    上次寫的爬蟲雖然數據爬下來了,但是有亂碼問題。查了相關的書之后,找到解決辦法。重新寫了一下,好像比之前更簡潔了。

    解決辦法是:引入iconv-lite模塊,用來轉換編碼的網頁內容。

這次跟著書上用了request模塊,而不是用原來的http模塊。

var request = require('request');
var cheerio = require('cheerio');
var iconv = require('iconv-lite');


//博客標題
request({
	url:'http://qmkkd.blog.51cto.com/',
	encoding:null
	},function(err,res,body){
	
	if(err) return console.log(err);

	body = iconv.decode(body,'gbk');

	//根據網頁內容創建DOM操作對象
	var $ = cheerio.load(body);

	//讀取博文類別列表
	var bloglist = [];
	$('.blogList .artHead h4 a').each(function(){
		var $me = $(this);
		var name = $me.text().trim();
		bloglist.push(name);
	});

	//輸出結果
	console.log(bloglist);
});



結果如下:

nodejs單頁面爬蟲(二)--解決編碼問題


向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

和顺县| 蒙自县| 桓台县| 崇文区| 柳林县| 项城市| 海伦市| 新建县| 宜州市| 泉州市| 二连浩特市| 郁南县| 阜平县| 长顺县| 上蔡县| 耒阳市| 新营市| 扶绥县| 彰化市| 衡南县| 竹北市| 米林县| 奉化市| 和顺县| 巴林左旗| 日照市| 襄城县| 饶阳县| 九江市| 龙海市| 古蔺县| 定日县| 襄城县| 运城市| 邳州市| 台山市| 荆州市| 英超| 松江区| 宁都县| 济南市|