「圖像分類」分類專欄正式上線啦!初入CV、AI你需要一份指南針

2019-07-19   有三AI

大家好,今天我將在有三AI開設新專欄《圖像分類》。在這個專欄中,我將全方位介紹圖像分類相關知識,並結合不同任務需求進行實戰,和大家一同走近這看似簡單卻包羅萬象的基礎性技術,同時指導計算機視覺、深度學習領域的初學者快速、準確、全面地掌握圖像分類的相關知識。

作者 | 郭冰洋

編輯 | 言有三


1 圖像分類簡介

圖像分類,即通過某種分類算法使計算機判斷輸入圖像所屬的類別。作為計算機視覺的基礎性任務,圖像分類是後續目標檢測、圖像分割的重要基礎,幾乎所有的工作都建立在圖像分類之上。近年來,隨著深度學習的發展,圖像分類取得了顯著進步,並在許多數據集上達到了超越人類的水準。越來越多的人們也開始重視對圖像分類和深度學習的研究。

2 專欄目錄與內容

目前,眾多教材和課程均以圖像分類作為深度學習的入門基礎,本專欄的開設目的也在於引導初學者快速、準確地進入計算機視覺領域和深度學習領域,為後續的工作打下一個良好的基礎。

目前,圖像分類專欄內容規劃如上圖所示,採用理論和實戰相結合的方法,針對子專題所涉及到的內容,均會進行相應的實踐操作,加深並強化知識的理解。

1、多類別圖像分類

專欄將由最基本的多類別圖像分類為基礎,介紹傳統的CNN分類網絡及其相應的特點,並動手搭建一個多類別圖像分類網絡,將涉及到圖像數據讀取、神經網絡搭建、評價指標計算等多個部分,通過完整的實戰實現圖像處理和深度學習的入門。

進行完初始的網絡搭建之後,我們將介紹提升網絡性能的相關策略,從原理和工程的角度理解超參數的選擇、網絡層數設置、數據處理等多種方法的優點和缺點,更進一步的加深對分類網絡的細節理解。

2、細粒度圖像分類

多類別圖像分類網絡在類別差異比較大的數據集上,甚至可以取得超過人類的準確率。但是當類別之間的差異非常小(如不同品牌之間的車型往往非常相似),亦或是類內差距非常大的情況下(如桌椅的造型非常之多),其準確度會大打折扣,這就涉及到細粒度圖像分類的相關研究。

第二部分我們將深入了解細粒度圖像分類的相關研究現狀,並結合兩個實際數據集,實現細粒度圖像分類,並與多類別圖像分類進行對比,發現其二者之間的差異,以達到具體問題具體分析的目的。

3、多標籤圖像分類

不論是多類別還是細粒度圖像分類,單張圖片中往往只含有一個類別信息,但在實際生活和工程應用中,某張圖片中包含著若干個目標,如上圖中含有人、狗和樹等多個類別信息。如何對多標籤圖像數據進行劃分和訓練,則是一個更具有挑戰性的問題。專欄第三部分將以Pascal VOC數據集為基準,實現多標籤圖像分類的數據讀取及網絡構建。

4、實例級圖像分類和無/弱監督圖像分類

實例級別的分類是指,對圖像中每個類別的子類或個體進行劃分,其實質和目標檢測中bounding box的分類訓練相同。該任務的難點在於,不僅要區分每個類別,還要正確區分每一個個體。

無/弱監督分類則是減少數據標記的參與程度,讓網絡自動劃分不同的類別。由於缺乏或沒有標記信息,無/弱監督圖像分類僅可以將不同類別的物體進行聚類,但並不能告知其類別到底是什麼。例如,一個包含貓和狗圖片的數據集,通過無/弱監督分類,可以將其劃分成兩部分,但具體哪部分是貓,哪部分是狗,則需要人為的進行判別。

上述兩個問題是目前圖像分類中更具有挑戰性且研究相對較難的部分,專欄的第四部分將對這兩種圖像分類的研究現狀和進展進行介紹,為感興趣的讀者提供一定的思路。

5、其他

除了上述四個部分,專欄還將對實際應用過程中可能出現的問題進行匯總,如樣本不平衡、無窮負樣本等,並結合現有的研究進展,進行相關的方案解讀。同樣,也會對分類網絡的若干應用進行介紹,如網絡可視化、參數可視化等,使你在整個學習過程中更好地了解網絡,認清神經網絡到底在幹什麼。

3 寫在後面的話

俗話說,萬事開頭難。想到自己進入圖像處理和深度學習領域踩過的諸多大坑,一直都想把自己的一些經驗和想法與大家進行分享,希望能幫助到更多的初學者避開一些彎路。

在有三的幫助和鼓勵下,萌生了開設專欄的念頭。才疏學淺,不敢造次。僅僅希望通過專欄的開設,竭盡所能幫助需要幫助的人,也進一步提高自己寫作的能力和基礎知識的鞏固。

最後,送給大家一句最喜歡的話:

「有志者,事竟成,百二秦關終屬楚;苦心人,天不負,三千越甲可吞吳」