CBNet:物體檢測的一種新的組合主幹網絡結構

2019-12-11     AI公園

作者:Tony Shin

編譯:ronghuaiyang

導讀

給大家介紹一種新的網絡架構,用來做物體檢測的,SOTA。

到目前為止,在COCO數據集上表現最好的物體檢測網絡是CBNet,在COCO測試數據集上的平均精度為53.3。

作者聲稱,合併一個更強大的主幹可以提高目標探測器的性能。為了做到這一點,他們提出了一種新的策略,通過相鄰的主幹之間的復合連接來裝配多個相同的主幹。通過這樣做,他們提出了一個更強大的主幹,稱為復合主幹網絡。

如圖所示,CBNet由多個相同的主幹網絡和相鄰主幹之間的復合連接組成。從左到右,每個階段的輸出在一個輔助主幹網中,這也可以看作是高層次的特徵。每個特徵層的輸出通過組合連接作為輸入的一部分流到後續主幹的並行級。通過這樣做,將多個高級和低級特性融合在一起,以生成更豐富的特徵表示。

本文介紹了兩種架構:雙骨幹網(DB)三骨幹網(TB)。從命名中可以猜到,DB由兩個相同的主幹組成,TB由三個相同的主幹組成。性能差異將在本文後面討論。

為了從主幹中組合多個輸出,本文引入了一個組合連接塊。該塊由一個1x1卷積和一個批處理歸一化層組成。添加這些層是為了減少通道的數量並執行上採樣操作。

最後的主幹(在圖中最右邊)稱為領導主幹,用於物體檢測。領導主幹的輸出特徵被輸入到RPN/檢測頭,而每個輔助主幹的輸出被輸入到相鄰的主幹。

組合風格

有四種主幹組合的形式:

  • 相鄰的高級組合是前面部分中介紹的樣式。來自輔助主幹網的每個輸出特徵使用復合連接塊輸入到相鄰的主幹網中。
  • 同層組合是另一種簡單的合成樣式,它將前一個主幹的相鄰低層階段的輸出提供給後一個主幹。如圖所示,此樣式不使用復合連接塊。來自低層主幹網的特徵被直接添加到相鄰的主幹網中。
  • 鄰近的低層組合非常類似於AHLC。唯一不同的是,來自前一個主幹網底層的特徵被傳遞給後續的主幹網。
  • 稠密的高層組合的靈感來自DenseNet,每一層都連接到所有後續的層,在一個階段建立一個稠密的連接。

上表顯示了不同組合風格的對比。我們可以觀察到,AHLC樣式優於其他復合樣式。這背後的原因在論文中有很好的解釋。作者認為,將前一個主幹的低層特徵直接添加到後續主幹的高層特徵中,會損害後一個主幹的語義信息。另一方面,在後續主幹的淺層特徵基礎上增加前一主幹的深層特徵,可以增強後一主幹的語義信息。

結果

上表顯示了MS-COCO測試數據集的檢測結果。第5-7列是物體檢測結果,第8-10列是實例分割結果。它清楚地表明,使用更多的骨幹架構提高了網絡的性能。

結論

文章提出了一種新型的網絡結構 — CBNet。通過組合多個主幹結構,該網絡將檢測網絡的精度提高了約1.5%到3%。

增加的參數大小和訓練時間值得進一步研究。

英文原文:https://medium.com/swlh/cbnet-a-novel-composite-backbone-network-architecture-for-object-detection-review-88b79a838ef1

請長按或掃描二維碼關注本公眾號

文章來源: https://twgreatdaily.com/zh/d3T5924BMH2_cNUgJVix.html