91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

如何進行百度指數突變點檢測

發布時間:2022-01-04 18:21:55 來源:億速云 閱讀:162 作者:柒染 欄目:大數據

如何進行百度指數突變點檢測,很多新手對此不是很清楚,為了幫助大家解決這個難題,下面小編將為大家詳細講解,有這方面需求的人可以來學習下,希望你能有所收獲。

百度指數是一款非常好用的工具,通過它我們能知道某些關鍵詞在過去的一些日子里的熱度變化趨勢并能夠對這些數據進行分析。如果能用得好百度指數,我們將能產出巨大的價值。你可以通過關注文章下方的Python實用寶典公眾號,回復 百度指數突變點 獲得本項目完整源代碼。

今天主要是來教大家如何找出百度指數中突變值的位置,如圖所示畫框框的部分:

如何進行百度指數突變點檢測

30天的數據流中很容易通過人工的方法找到突變數據的位置,但如果是180天呢?這可就不好通過人工的方式來查找了:

如何進行百度指數突變點檢測

如何使用Python自動找出這180天里的突變點?由于這里涉及到了對時間序列的突變點的檢測,我們可以使用一種叫 Pettitt突變點檢測 算法。

1.獲取數據

通過開發者工具找到數據接口,結果發現其接口返回來的數據進行了加密:

如何進行百度指數突變點檢測

看起來就很像字符串替換,如果要從頭開始解密的話需要做一些對比工作(把源數據和該加密數據放一起進行比較)或者直接看前端源代碼 。由于這里不是今天要講的重點內容,我直接使用了他人的開源項目并做了一些修改, 百度指數爬蟲 :
https://github.com/longxiaofei/spider-BaiduIndex/tree/master/new_spider_without_selenium

你可以通過關注文章最下方的公眾號(Python實用寶典),回復 百度指數突變點 獲得本文所有的源代碼。

調用接口爬取數據,然后將爬取到的數據按照關鍵詞存放到數組中,你可以很輕易地修改我的代碼增加/減少關鍵詞,這里我為了簡化問題,僅選擇區塊鏈一個關鍵詞進行分析。代碼如下:

如何進行百度指數突變點檢測

結果如下:

如何進行百度指數突變點檢測

2.突變點算法

Pettitt突變點檢測算法是用R語言寫的,實現其實很簡單。作者并沒有說為什么這么做,而是給了相應的數學公式,我們試著跟著作者的思路走,看看效果如何。

如何進行百度指數突變點檢測

算法代碼如下:

如何進行百度指數突變點檢測

接下來需要將數據傳入該函數,就能得到這段數據的突變點(一個),由于它只能找出一段數據里的一個突變點,而我們需要獲得的是多個突變點,因此還得設置一個移動窗口,獲得每個窗口中的突變位置。

3.設置窗口獲得每個窗口的突變位置

將數據設為30天一個窗口,檢測每個窗口中的突變值:

如何進行百度指數突變點檢測

結果如下:

如何進行百度指數突變點檢測

這樣看實在是不好看出效果,讓我們用matplotlib可視化一下:

如何進行百度指數突變點檢測

結果:

如何進行百度指數突變點檢測

說實話,不太滿意這個結果,有兩個突變點竟然沒找出來,其中右邊那個突變點其實比較重要。除開這兩個突變點不說,整體上看,這個檢測方法的效果還可以。

看完上述內容是否對您有幫助呢?如果還想對相關知識有進一步的了解或閱讀更多相關文章,請關注億速云行業資訊頻道,感謝您對億速云的支持。

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

泉州市| 中牟县| 子洲县| 卢氏县| 中卫市| 西和县| 斗六市| 剑河县| 岳普湖县| 子长县| 东明县| 天水市| 岑巩县| 郎溪县| 嘉义县| 广饶县| 察雅县| 泗阳县| 周宁县| 简阳市| 和平区| 黑龙江省| 合水县| 滕州市| 山阴县| 稻城县| 东乡族自治县| 黎城县| 富阳市| 万宁市| 西青区| 建瓯市| 越西县| 德保县| 尚义县| 青田县| 新安县| 灵寿县| 定结县| 巴东县| 平罗县|