您好,登錄后才能下訂單哦!
本篇內容介紹了“python矩陣分解原理是什么”的有關知識,在實際案例的操作過程中,不少人都會遇到這樣的困境,接下來就讓小編帶領大家學習一下如何處理這些情況吧!希望大家仔細閱讀,能夠學有所成!
矩陣分解是推薦系統系列中的一種算法,顧名思義,就是將矩陣分解成兩個(或多個)矩陣,它們相乘后得到原始矩陣。在推薦系統中,我們通常從用戶與項目之間的交互/評分矩陣開始,矩陣分解算法會將用戶和項目特征矩陣分解,這也稱為嵌入。下面以電影推薦中的評分,購買等矩陣為例。
通常,在數據集中,要挖掘用戶和項目屬性的潛在特征。本質上,潛在特征是用戶/項目在任意空間中的表示,表示用戶如何評價電影。在電影推薦系統的示例中,一個用戶樣本中包含了他所觀看的多個電影,潛在特征的值越高,則表示他喜歡該類型的電影,那么就應該推薦此類型的電影。
本文所用數據來自kaggle,包含了76000個用戶樣本。
首先,導入數據和有關庫。
from recsys import *
from generic_preprocessing import
from IPython.display import HTML ## 以Ipython Notebook顯示
import pandas as pd,numpy as np
anime = pd.read_csv('anime.csv')
ratings = pd.read_csv('rating.csv').iloc[:5000000]
為了創建推薦系統,我們需要一個可交互的矩陣。為此,使用recsys
模塊中的create_interaction_matrix
函數,這個函數要求以Pandas的DataFrame類型的數據為輸入,輸入數據的列必須有諸如用戶id,項目id和評分等。此函數的中如果設置norm=True
,則意味著任何評分的值都應該是正的。在這個示例中,沒有必要設置,因為實際的購買數據和評分都是正的。
# 利用評分數據創建矩陣
interactions = create_interaction_matrix(df = ratings,
user_col = ‘user_id’,
item_col = ‘anime_id’,
rating_col = ‘rating’)
interactions.shape
然后用create_user_dict
和create_item_dict
函數(recsys
模塊)創建關于用戶和項目的字典。
# 用戶字典
user_dict = create_user_dict(interactions=interactions)
# 項目字典
movies_dict = create_item_dict(df = anime,
id_col = 'anime_id',
name_col = 'name')
用recsys
中的runMF
函數來創建矩陣分解模型,這個函數的參數:
interaction
:前面所創建的矩陣n_components
:對于每個用戶和項目嵌入的數量loss
:定義一個損失函數,本例中我們使用warp損失函數,因為我們更關心矩陣的秩。epoch
:運行的次數n_jobs
:并行處理中使用的核數mf_model = runMF(interactions = interactions,
n_components = 30,
loss = 'warp',
epoch = 30,
n_jobs = 4)
“python矩陣分解原理是什么”的內容就介紹到這里了,感謝大家的閱讀。如果想了解更多行業相關的知識可以關注億速云網站,小編將為大家輸出更多高質量的實用文章!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。