您好,登錄后才能下訂單哦!
周杰倫作為天王,具有劃時代的意義毋庸置疑,他的歌伴隨了多少個90后的日日夜夜,是多少人的回憶和情懷!
9 月 16 日晚間,一代天王周董發布了最新單曲 《說好不哭》
發布后,真的讓一波人哭了
一群想搶鮮聽的小伙伴直接淚奔
因為 QQ 音樂直接被搞崩了
沒想到干翻 QQ 音樂的不是網易云音樂
也不是蝦米音樂
而是周董!
周董成成功地憑一己之力干翻了 QQ 音樂
那么聽過周董新歌后的小伙伴都是怎么評價的呢?
這里,我們獲取了 QQ 音樂的近 20W 條評論數據進行分析
看看其中有哪些有趣的東西
1、請求分析
在 QQ 網頁版直接搜索『說好不哭』
很容易就能找到單曲頁面
說好不哭
拉到頁面最下方
可以看到評論的分頁查看按鈕
分頁查看
按下 F12 點擊第二頁
在請求流中就可以看到對應的請求
評論請求
其中可以看到兩個重要參數: pagenum 和 pagesize
將請求 copy 到 Postman 中進行測試
Postman測試
發現可以直接獲取到數據
連 Header 都不需要添加
這里嘗試對請求參數進行了精簡
最終只需要如下幾個參數即可
參數精簡
從 Postman 中可以直接獲取到對應的代碼
import requests url = "https://c.y.qq.com/base/fcgi-bin/fcg_global_comment_h6.fcg" querystring = {"biztype":"1","topid":"237773700","cmd":"8","pagenum":"1","pagesize":"25"} response = requests.request("GET", url, params=querystring) print(response.text)
這里是單頁評論的獲取
所有評論的獲取只需遞增 pagenum 即可
2、數據解析
返回數據中有很多暫時不需要的字段
這里我們只取其中的用戶名、評論時間、評論內容、點贊數
對應如下字段
{ "nick": "丨那壹刻永遠消失\"\"", "praisenum": 1, "rootcommentcontent": "越聽越好聽怎么回事!", "time": 1568729836,}
由于數據量較大 這里我們暫時將數據存放在 Excel 中
一來無須依賴外部數據庫
二來可以使用 Excel 對數據進行二次處理
數據存儲代碼如下:
def file_do(list_info, file_name): # 獲取文件大小 if not os.path.exists(file_name): wb = openpyxl.Workbook() page = wb.active page.title = 'jay' page.append(['昵稱','時間','點贊數','評論']) else: wb = openpyxl.load_workbook(file_name) page = wb.active for info in list_info: try: page.append(info) except Exception: print(info) wb.save(filename=file_name)
1、各時段的評論數
首先我們對評論按小時區間進行匯總
由于時間粒度比較小,這里對時間粒度進行了一些處理
評價人數走勢圖
周董的新曲是在 9.16 號 23 點準時發布的
可以看出在發布后的一個小時內(23:00-24:00)
評論數量達到了高峰
占了總評論數的一半以上
另外看了一眼 9.16 23 點之前的評論也很有意思
一種搬好小板凳嗑著瓜子坐等的既視感
2、大家都在說什么
詞云生成的方法有很多
可以用代碼生成
也可以用一些在線工具
這里我就使用了在線詞云工具:wordart
后續可以給大家單獨再普及一下
生成效果如下
詞云
周杰倫、杰倫字眼很明顯
還有大量跑來『打卡』的
『好聽』、『來了』、『哭了』、『愛了』
其中少不了的還有『青春』
另外『阿信』的出現估計給了很多人驚喜
3、大家都點贊了哪些評論
我們以點贊數對評論進行了排序
排名靠前的評論是如下一些
評論排名
另外,QQ 音樂官方也會放出精彩評論
熱心網友昀愷丶
涼城
蝸牛..
對比下可以看出和我們獲取到的數據是比較一致的
只不過官方并不是按點贊個數進行排名的
看得出來這些排名靠前的大都是在回憶青春
這些評論之所以能夠得到大家的共鳴
也許他們的青春里都有一個周杰倫吧
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。