您好,登錄后才能下訂單哦!
本篇文章為大家展示了Python中怎么構建一個FP-growth算法,內容簡明扼要并且容易理解,絕對能使你眼前一亮,通過這篇文章的詳細介紹希望你能有所收獲。
FP算法發現頻繁項集的過程是:
(1)構建FP樹;
(2)從FP樹中挖掘頻繁項集
FP表示的是頻繁模式,其通過鏈接來連接相似元素,被連起來的元素可看成是一個鏈表
將事務數據表中的各個事務對應的數據項,按照支持度排序后,把每個事務中的數據項按降序依次插入到一棵以 NULL為根節點的樹中,同時在每個結點處記錄該結點出現的支持度。
假設存在的一個事務數據樣例為,構建FP樹的步驟如下:
結合Apriori算法中最小支持度的閾值,在此將最小支持度定義為3,結合上表中的數據,那些不滿足最小支持度要求的將不會出現在***的FP樹中。
據此構建FP樹,并采用一個頭指針表來指向給定類型的***個實例,快速訪問FP樹中的所有元素,構建的帶頭指針的FP樹如圖:
結合繪制的帶頭指針表的FP樹,對表中數據進行過濾,排序如下:
在對數據項過濾排序了之后,就可以構建FP樹了,從NULL開始,向其中不斷添加過濾排序后的頻繁項集。過程可表示為:
上述內容就是Python中怎么構建一個FP-growth算法,你們學到知識或技能了嗎?如果還想學到更多技能或者豐富自己的知識儲備,歡迎關注億速云行業資訊頻道。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。