91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》
  • 首頁 > 
  • 教程 > 
  • 開發技術 > 
  • 好記性不如爛筆頭——關于精確度、召回率、F值、準確率

好記性不如爛筆頭——關于精確度、召回率、F值、準確率

發布時間:2020-04-14 01:26:04 來源:網絡 閱讀:524 作者:jch_zhao 欄目:開發技術

將數據挖掘中這些評測指標的基本概念做一整理,忘了的時候還可以來查一查。

精確度,有時也叫正確率,是英文中的precision而不是accuracy。表示正確識別為此類的樣本數目(TP)/識別為此類的樣本總數目(TP+FP)。FP就是那些原本不是此類但被錯誤的分為此類的樣本數目。

召回率,這個名稱容易使人把它和召回缺陷產品的比率聯想到一起,完全不是一碼事。所以另外一種翻譯的名稱更合適:查全率。表示正確識別為此類的樣本數目(TP)/真實情況下的此類的樣本數目(TP+FN)。那么真實情況包括哪些呢?一部分自然是正確分類的TP,另一部分就是那些被錯誤地分到了其他類的樣本數目(FN)

所以,公式:
P=TP/(TP+FP)
R=TP/(TP+FN)

還是舉個例子吧。網上多數介紹僅用兩個分類舉例,所以容易把FP和FN錯誤的當成一個數,其實應該是多個數的和。這里我舉個3分類的例子。假定我們有24個樣本,真實情況是10個red類,8個yellow類,6個blue類。

用weka做了個例子,假定系統給出的結果如下:
 a b c   <-- classified as
 9 1 0 | a = red
 1 7 0 | b = yellow
 1 1 4 | c = blue

是這樣看的:橫向為真實情況,縱向為工具分類結果。即:有11個樣本被當作red類。而這11個樣本中,有9個確實是red類,還有一個其實是yellew,另一個其實是blue;有9個樣本被當作yellow類。這9個樣本當中,有7個確實是yellow,還有一個其實是red,另一個其實是blue;有4個樣本被當作blue類。而這4個樣本也確實是blue。

那么根據前面的公式,可以對red、yellow、blue分別計算正確率和查全率了。

P(red)=9/11  R(red)=9/10
P(yellow)=7/9  R(yellow)=7/8
P(blue)=4/4  R(blue)=4/6

那么我們從直觀上感覺一下分類的好壞,正確率雖然很關鍵,但光有正確率是不夠的。比如blue,正確率是100%,但其實只是把2/3的數據挑出來了,還有1/3搞錯了。那么更極端的假想一下,如果某一類實際上有10000個樣本,最后只分出一個,對是對了。此時正確率還是100%,但我們能認為這個分類結果是可以接受嗎?顯然不行。所以P值和R同時要比較高才好。于是有了F指標:

F=2*P*R/(P+R)

最后再來說說accuracy,這個通常翻譯成準確率。也是一個綜合指標:
A=(TP + TN)/(P+N),表示正確分類的樣本數目/所有樣本總數目。同樣,這個分子的寫法也容易讓人誤認為是兩個數的和,其實不止。
對于上面那個例子來說,準確率應該是:
A=(9+7+4)/(10+8+6)


向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

肇州县| 磐石市| 临沧市| 东海县| 陵水| 泌阳县| 宁强县| 溆浦县| 蒙山县| 孝昌县| 厦门市| 呼伦贝尔市| 普兰店市| 石楼县| 台南市| 德保县| 扎赉特旗| 鄯善县| 射洪县| 逊克县| 江北区| 茶陵县| 黔西县| 清苑县| 崇阳县| 襄汾县| 福清市| 汕头市| 洛扎县| 靖边县| 怀柔区| 潢川县| 古丈县| 无棣县| 扶绥县| 平阴县| 麻江县| 涡阳县| 临猗县| 岐山县| 休宁县|