很多朋友都希望我們開通論文推薦和閱讀板塊,那就開吧,此專欄名為《每周論文推薦》。在這個專欄里,還是本著有三AI一貫的原則,專注於讓大家能夠系統性完成學習,所以我們推薦的文章也必定是同一主題的。
網絡模型作為深度學習的幾大核心問題之一,今天就給初入深度學習CV領域的朋友推薦一些必讀的文章,相信讀完這些文章之後,大家對這個主題會有更深刻的體會。
作者&編輯 | 言有三
1 視覺機制的研究
這篇文章是對視覺機制的重要研究,由現代視覺科學之父,諾貝爾生理學與醫學獎獲得者,加拿大神經生理學家 David Hunter Hubel 和瑞典神經科學家 Torsten Nils Wiesel所寫,是CNN的啟蒙。
文章引用量:13000+
推薦指數:
[1] Hubel D H, Wiesel T N. Receptive fields, binocular interaction and functional architecture in the cat's visual cortex[J]. The Journal of physiology, 1962, 160(1): 106-154.
2 第一個圖像CNN網絡
1980 年日本 NHK 技術研究所的研究員福島邦彥提出了Neocognitron網絡,這是第一個真正意義上的多層級聯神經網絡,與當前的卷積神經網絡結構非常相似,可以認為是卷積神經網絡的起源。
文章引用量:3000+
推薦指數:
[2] Fukushima K. Neocognitron: A self-organizing neural network model for a mechanism of pattern recognition unaffected by shift in position[J]. Biological cybernetics, 1980, 36(4): 193-202.
3 LeNet5
從1989年開始紐約大學的Yann LeCun等人開始認真研究卷積神經網絡,並提出了LeNets網絡系列,疊代了近10年,從LeNet1直到大家最為熟悉的LeNet5誕生。這是卷積神經網絡真正商用化的開始,也是反向傳播理論大放異彩的開始,可稱之為卷積神經網絡的Hello World。
文章引用量:19000+
推薦指數:
[3] LeCun Y, Bottou L, Bengio Y, et al. Gradient-based learning applied to document recognition[J]. Proceedings of the IEEE, 1998, 86(11): 2278-2324.
4 深度學習啟蒙
2006年Geoffrey Everest Hinton等人在《Science》雜誌上發表文章《reducing the dimensionality of data with neural networks》,提出了參數逐層初始化的DBN網絡的訓練,一般被認為是「深度學習」的啟蒙。
文章引用量:9000+
推薦指數:
[4] Hinton G E, Salakhutdinov R R. Reducing the dimensionality of data with neural networks[J]. science, 2006, 313(5786): 504-507.
5 深度學習里程碑
2012年,在圖像領域中具有里程碑意義的ImageNet競賽中,Geoffrey Hinton的學生Alex Krizhevsky提出了 AlexNet,憑藉若干優秀的工程技巧一舉奪魁遠超對手,意味著深度學習強勢誕生。
文章引用量:43000+
推薦指數:
[5] Krizhevsky A, Sutskever I, Hinton G E. Imagenet classification with deep convolutional neural networks[C]//Advances in neural information processing systems. 2012: 1097-1105.
6 CNN可視化
2013年Hinton的學生Matthew D. Zeiler和Rob Fergus 在論文「Visualizing andUnderstanding Convolutional Networks」中提出了zfnet,他們利用反卷積技術對CNN進行了可視化,詳細探討了CNN的分層抽象學習能力。
文章引用量:6000+
推薦指數:
[6] Zeiler M D, Fergus R. Visualizing and understanding convolutional networks[C]//European conference on computer vision. Springer, Cham, 2014: 818-833.
7 CNN重要基準模型
2014年牛津大學視覺組在論文「very deep convolutional networks for large-scale image recognition」中提出了VGGNet,分別在ImageNet的定位和分類任務中取得第一名和第二名,以簡單的工程技巧成為了至今仍然被廣泛使用的baseline。
文章引用量:24000+
推薦指數:
[7] Simonyan K, Zisserman A. Very deep convolutional networks for large-scale image recognition[J]. arXiv preprint arXiv:1409.1556, 2014.
8 1*1卷積
這只是一個將普通卷積核半徑變為1的卷積方式,卻影響了之後幾乎所有的模型,將這個1×1的特殊卷積用於通道的降維和升維,已經成為模型設計不可缺少的組件。
文章引用量:4000+
推薦指數:
[8] Lin M, Chen Q, Yan S. Network in network[J]. arXiv preprint arXiv:1312.4400, 2013.
9 Inception機制
在VGG網絡不能再通過加深得到進一步性能突破的時候,Inception模型(又名GoogLeNet)使用了擁有不同感受野並行的多分支Inception結構,進一步加深了網絡深度並成為當年的基準模型。
文章引用量:14000+
推薦指數:
[9] Szegedy C, Liu W, Jia Y, et al. Going deeper with convolutions[C]//Proceedings of the IEEE conference on computer vision and pattern recognition. 2015: 1-9.
除了以上文章,還有幾篇文章推薦大家也去閱讀,包括第一個語音CNN網絡[10],小卷積的機制研究[11]等。
[10] Waibel A, Hanazawa T, Hinton G, et al. Phoneme recognition using time-delay neural networks[J]. Backpropagation: Theory, Architectures and Applications, 1995: 35-61.
[11] Ciresan D C, Meier U, Masci J, et al. Flexible, high performance convolutional neural networks for image classification[C]//Twenty-Second International Joint Conference on Artificial Intelligence. 2011.
10 如何獲取文章與交流
找到有三AI開源項目即可獲取。
https://github.com/longpeng2008/yousan.ai
文章細節眾多,閱讀交流在有三AI知識星球中進行,感興趣可以加入。
總結
以上就是CNN發展早期的一些重要論文,下一期我們將推薦殘差網絡結構相關的研究。