您好,登錄后才能下訂單哦!
本篇內容介紹了“機器學習中生成模型和判別模型是什么”的有關知識,在實際案例的操作過程中,不少人都會遇到這樣的困境,接下來就讓小編帶領大家學習一下如何處理這些情況吧!希望大家仔細閱讀,能夠學有所成!
我們從幾句話進入這兩個概念:
1、機器學習分為有監督的機器學習和無監督的機器學習;
2、有監督的機器學習就是已知訓練集數據的類別情況來訓練分類器,無監督的機器學習就是不知道訓練集的類別情況來訓練分類器;
3、所以說,有監督的機器學習可以抽象為一個分類 task,而無監督的基本完成的是聚類;
4、有監督的機器學習中,我們可以概述為通過很多有標記的數據,訓練出一個模型,然后利用這個,對輸入的X進行預測輸出的Y。這個模型一般有兩種:
決策函數:Y=f(X)
條件概率分布:P(Y|X)
5、根據通過學習數據來獲取這兩種模型的方法,我們可以分為判別方法和生成方法;
6、概念正式介紹
判別方法:由數據直接學習決策函數Y=f(X)或條件概率分布P(Y|X)作為預測模型,即判別模型。判別方法關心的是對于給定的輸入X,應該預測什么樣的輸出Y。
數據直接學習決策函數 Y=f(X) 或條件概率分布 P(Y|X) 得到的預測模型,就是判別模型;
生成方法:由數據學習聯合概率分布P(X,Y), 然后由P(Y|X)=P(X,Y)/P(X)求出概率分布P(Y|X)作為預測的模型。該方法表示了給定輸入X與產生輸出Y的生成關系
P(Y|X)作為的預測的模型就是生成模型;
生成模型:樸素貝葉斯(Naive Bayes)、隱馬爾可夫(EM 算法)
判別模型:k近鄰法、感知機、決策樹、邏輯回歸、線性回歸、最大熵模型、支持向量機(SVM)、提升方法、條件隨機場(CRF),神經網絡
1、生成模型可以還原出聯合概率分布(還原數據本身相似度),而判別方法不能;
2、生成方法的學習收斂速度更快,當樣本容量增加的時候,學到的模型可以更快的收斂于真實模型;
3、當存在隱變量時,仍可以利用生成方法學習,此時判別方法不能用;
4、判別學習不能反映訓練數據本身的特性,但它尋找不同類別之間的最優分類面,反映的是異類數據之間的差異,直接面對預測,往往學習的準確率更高,由于直接學習P(Y|X)或Y=f(X),從而可以簡化學習;
5、簡單的說,生成模型是從大量的數據中找規律,屬于統計學習;而判別模型只關心不同類型的數據的差別,利用差別來分類。
判別模型 是在你生父身高超過180的已知條件下,預測你身高會不會超過180。如果你生父比180高,那么你比180高的概率會增加。但是全世界人身高的概率分布暫時并沒有改變。(為了科學的嚴謹,這里爸爸已經改成了生父而非父親)
生成模型 則是隨機賜予你一個成年后的最高身高。身高超過180的概率是多少,這個概率只能依照全世界所有成人的身高的頻率分布來決定。
“機器學習中生成模型和判別模型是什么”的內容就介紹到這里了,感謝大家的閱讀。如果想了解更多行業相關的知識可以關注億速云網站,小編將為大家輸出更多高質量的實用文章!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。