Fast concurrent object localization and recognition
T. Yeh, J.J. Lee, and T. Darrell
CVPR '09
=====================================================
這次換我報告,所以比較晚補上來
這篇主要的目的是要improve ESS 對於multi query model的改進
原本的ESS是針對某一種 query model 去作有效率的sub-window search
但如果query model 是很多種的時候(ex: 120),如果是重複做120遍
那就會變得很沒有效率,需要花費很多時間,這篇的目的就是要改進這樣的作法
作者把這樣的方法稱作 Concurrent Localization and Recognition (CLR) 以下用CLR來稱呼
其實CLR說穿了跟ESS相比,就差在每個iteration會去切那個object boundary
所以當x, y 的boundary找出來的時候,同時也知道這個區域比較像哪一個object
方法是用 vocabulary tree 先建好每個bag of word(BoW)的inverted index
然後透過SVM去learn出query models 對應BoW的weight
最後用這些 weight去算出每個 boundary candidate 的 score
利用score去算出和哪些model比較相似
比較technical的部分是:
利用upper bound來作為branching and bounding的依據
所以子集合的upper bound < 母集合,有這個條件 bounding才能成立
然後透過每種 query upper bound 來切割每個iteration 的 object candidate
這篇有趣的地方是它提出了以下兩個idea
1. Multi-instance CLR
就是在target image裡面有不只一個object
這裡提出的方法是當找到那個object之後就把那個區域所有的BoW都挖掉
2. Polygons bounding
利用多邊形(ex: 三角形或組合多個矩形)來作bounding
不過上面兩個idea在這篇裡面都沒有多作探討
實驗的部分有詳細說明為什麼不用既有的dataset
a. Caltech256: 背景太乾淨
b. PASCAL: model class 太少
然後實驗的時候有跟各個model來比較以及各model的好壞
像是BoF的方法雖然快,但無法找出object的位置
ISM 的方法應該算是state-of-art 但是花的時間太多
=========================================================
優點:
1. data-dependent: 會考慮feature 的位置來作branching and bounding
2. Multi-class
3. Branching and bounding on objects
4. Flexible bounding geometries
5. 實驗的說明跟比較很全面且詳細
缺點:
1. query models 雖然是很多個,但都是事先給死的,所以可以off-line 建好
2. Flexible bounding 這部分的著墨比較少
沒有留言:
張貼留言