您好,登錄后才能下訂單哦!
這篇文章主要講解了“GVCNN的網絡結構是怎樣的”,文中的講解內容簡單清晰,易于學習與理解,下面請大家跟著小編的思路慢慢深入,一起來研究和學習“GVCNN的網絡結構是怎樣的”吧!
網絡結構:
覺得眼熟嗎?看看前端輸入的一排圖片,是不是和MVCNN非常像。來看一下MVCNN的網絡結構:
你可能已經猜到了,其實GVCNN就是對MVCNN做了改進。
MVCNN又是什么來路呢?
它可是最早將深度學習引入到三維形狀識別中來的,早在ICCV2015會議上發表出來,當時就已經能在ModelNet40數據集上跑出90.1%的成績了,可以說是師爺級的網絡了。
后續的各種處理點云的方法,都會與它做比較。
它的思路其實很簡單,對于三維物體,從多個視角去‘拍照’,得到12幅圖片,然后碼12個VGG網絡上來,進行特征提取,把12組特征進行池化后,進行分類。
所以,MVCNN的缺點也很明顯,網絡巨大。這與當今小型化的趨勢明顯不符嘛!這么大的網絡,別說往移動終端部署了,就是桌面電腦,跑起來都費勁。所以,這個網絡的follower一直也不多。
筆者倒是見過一篇比較老的論文,是把三維物體往球形上面做投影,同樣是把三維轉換成多個二維圖像去處理,跟MVCNN的區別是,往球型投影比平面投影更能反映三維物體的屬性
再來看今天的主角GVCNN,它的改進是,把12幅圖片進行了分組、加權。
作者考慮到,MVCNN中的12幅圖像其實權重是一樣的,但是實際當中肯定12幅圖像對于分類的貢獻是有高有低,通過合理加權,自然可以提高分類準確率。
具體操作就如上圖,每個圖片得到一組特征值,通過FC層獲得分數,對分數進行分組,比如圖中分成了三組。
然后,在組內按照MVCNN原來的池化操作進行。組間則是加權后在平均池化,得到最后結果。
下面是結果了:
可以看到,提升效果還是很明顯的。
感謝各位的閱讀,以上就是“GVCNN的網絡結構是怎樣的”的內容了,經過本文的學習后,相信大家對GVCNN的網絡結構是怎樣的這一問題有了更深刻的體會,具體使用情況還需要大家實踐驗證。這里是億速云,小編將為大家推送更多相關知識點的文章,歡迎關注!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。