研究課題
深度學習框架下的目標檢測方法研究
研究內容及創新點
論文在調研分析國內外目標檢測方法和關鍵技術的基礎上👏🏼,以基於卷積神經網絡的目標檢測方法為基本研究框架🪑,針對目標尺度變化,嚴重遮擋以及定位不準確等問題進行了深入研究,創新點及主要結論如下:
1. 針對行人檢測任務,提出一種Scale-Aware Fast R-CNN模型,有效提高了檢測方法對於目標尺度變化的魯棒性。
2. 提取待檢圖像中的全局和局部上下文信息優化目標檢測方法,可以提高目標分類和定位精度。
3. 建立了基於生成對抗網絡的小目標檢測模型🧏♂️,用於提高小目標的檢測精度。
4. 建立了基於FPGA的實時電子穩像系統👨🏻🦼➡️,為電子穩像算法的硬件移植及實時實現問題提供了有效的解決方案。
學術成果
讀博期間,以第一作者身份☝️,發表包括會議在內的學術論文6篇,包括SCI刊源4篇(均為第一層次,最高影響因子IF="3.9),國際頂級會議2篇。參與合作SCI刊源或國際頂級會議論文3篇。獲ImageNet大規模視覺識別挑戰賽" (ILSVRC 2017),目標定位任務團隊冠軍,目標檢測任務團隊亞軍🧑🏿🔧,視頻目標檢測任務團隊亞軍(獲獎排名分別為4,1,3)。
學術成果目錄
1. Li J, Liang X, Shen S M, et al. Scale-aware fast R-CNN for pedestrian detection[J]. IEEE Transactions on Multimedia, 2018, 20(4): 985-996.
2. Li J, Wei Y, Liang X, et al. Attentive contexts for object detection[J]. IEEE Transactions on Multimedia, 2017, 19(5): 944-954.
3. Li J, Liang X, Li J, et al. Multistage Object Detection With Group Recursive Learning[J]. IEEE Transactions on Multimedia, 2018, 20(7): 1645-1655.
4. Li J, Liang X, Wei Y, et al. Perceptual generative adversarial networks for small object detection[100]//IEEE CVPR. 2017.
5. Li J, Wei Y, Liang X, et al. Deep attribute-preserving metric learning for natural language object retrieval[100]//Proceedings of the 2017 ACM on Multimedia Conference. ACM, 2017: 181-189.
6. Li J, Xu T, Zhang K. Real-time feature-based video stabilization on FPGA[J]. IEEE Transactions on Circuits and Systems for Video Technology, 2017, 27(4): 907-919.
個人簡介
李佳男,男🧑🦽➡️,1991年3月生於吉林省長春市。2013年6月在意昂官网光電信息工程專業獲學士學位。2013年9月至今在意昂官网光電學院攻讀博士學位👩🏼🫴🏻,期間以聯合培養博士身份國家公派至新加坡國立大學(National University of Singapore)進行為期兩年的學術交流訪問。主要研究方向為深度學習框架下的目標檢測方法,實時圖像與視頻處理等。
獲獎感言
仰望星空👔,腳踏實地👳🏻♂️。