北理工團(tuán)隊在紅外弱小集群目標(biāo)檢測領(lǐng)域取得新突破
發(fā)布日期:2025-09-11 供稿:光電學(xué)院 攝影:光電學(xué)院
編輯:盛筠 審核:李家方 閱讀次數(shù):
近日,北京理工大學(xué)光電學(xué)院許廷發(fā)教授科研團(tuán)隊在紅外弱小集群目標(biāo)檢測方面取得新的進(jìn)展,針對紅外成像時序信息利用不足、弱小集群目標(biāo)信噪比低、背景復(fù)雜等核心難題,科研團(tuán)隊提出了一步式Transformer檢測方法,研究成果以 “OSFormer: One-Step Transformer for Infrared Video Small Object Detection” 為題,發(fā)表于國際計算機(jī)視覺與圖像處理領(lǐng)域頂級期刊《IEEE Transactions on Image Processing》(TIP,CCF-A 類),TIP是電氣與電子工程師協(xié)會(IEEE)旗下的圖像處理領(lǐng)域頂級學(xué)術(shù)期刊,被中科院SCI大類分區(qū)評為一區(qū)TOP期刊,并被中國計算機(jī)學(xué)會(CCF)推薦為A類期刊。論文第一作者為北京理工大學(xué)秦昊林博士研究生,通訊作者為許廷發(fā)教授和李佳男長聘副教授。
提出的一步式Transformer檢測范式(OSFormer)結(jié)構(gòu)如圖1所示。該范式將視頻序列轉(zhuǎn)換為立方體格式數(shù)據(jù),通過單次推理完成多幀同步分析;設(shè)計可變尺寸補(bǔ)丁注意力(Varied-Size Patch Attention,VPA)模塊,解決特征細(xì)粒度與計算成本的矛盾;集成多普勒自適應(yīng)濾波器,分離運動目標(biāo)信號與背景噪聲干擾。

圖1. OSFormer結(jié)構(gòu)圖
通過在不同紅外數(shù)據(jù)集上驗證,該方法實現(xiàn)了城市、山地等復(fù)雜背景下對低空無人機(jī)單目標(biāo)和集群目標(biāo)的精準(zhǔn)檢測,如圖2、圖3和圖4所示。將方法拓展至可見光模態(tài),OSFormer 仍展現(xiàn)出優(yōu)異的性能。

圖2. OSFormer在AntiUAV數(shù)據(jù)集上的檢測效果

圖3. OSFormer在InfraredUAV數(shù)據(jù)集上的檢測效果

圖4. OSFormer在UAVSwarm數(shù)據(jù)集上的檢測效果
該方法突破了紅外弱小集群目標(biāo)檢測技術(shù)瓶頸,有效解決了 “時序信息利用、小目標(biāo)特征捕捉、背景噪聲抑制” 三大核心問題,提供了高效精準(zhǔn)的技術(shù)方案。研究成果對未來
論文詳情:Haolin Qin, Tingfa Xu, Yuan Tang, Fengxiang Xu and Jianan Li. 2025. OSFormer: One-Step Transformer for Infrared Video Small Object Detection. IEEE Transactions on Image Processing, doi: 10.1109/TIP.2025.3598426.
論文鏈接:https://ieeexplore.ieee.org/document/11130659
論文第一作者簡介:
秦昊林,2022級北京理工大學(xué)博士研究生,師從許廷發(fā)教授,主要研究方向為智能目標(biāo)探測、圖像處理技術(shù)。在高水平期刊IEEE TIP、IEEE TNNLS、IEEE TGRS及頂會CVPR等發(fā)表論文16篇,其中第一作者7篇。入選首屆中國科協(xié)青年人才托舉工程博士生專項計劃,獲得全國光學(xué)與光學(xué)工程博士生學(xué)術(shù)聯(lián)賽全國百強(qiáng)。
論文通訊作者簡介:
李佳男,北京理工大學(xué)光電學(xué)院,長聘副教授,博士生導(dǎo)師,主要研究方向為光電成像目標(biāo)多維探測與感知技術(shù)研究。連續(xù)兩年入選全球前2%頂尖科學(xué)家(2023、2024年)。以第一或共同第一作者發(fā)表論文20篇,包括IEEE TPAMI論文5篇;以通訊作者發(fā)表論文60余篇。其中,3篇論文入選ESI高被引,2篇一作論文單篇引用超千次,谷歌學(xué)術(shù)總引用5600次。主持國家自然科學(xué)基金、工信部高質(zhì)量發(fā)展專項(課題)等項目10項。入選中國科協(xié)、北京市科協(xié)青托。獲得地理信息科技進(jìn)步二等獎(序2),中國圖象圖形學(xué)學(xué)會優(yōu)博,王大珩學(xué)生光學(xué)獎等。指導(dǎo)學(xué)生獲得反無人機(jī)跟蹤挑戰(zhàn)賽國際冠軍等競賽獎項10余項。研究成果應(yīng)用于“中國天眼”、礦產(chǎn)開發(fā)遙感監(jiān)測等領(lǐng)域。
許廷發(fā),博士,教授/博導(dǎo),國家一級重點學(xué)科“光學(xué)工程”學(xué)科責(zé)任教授,光電成像技術(shù)與系統(tǒng)教育部重點實驗室主任,北京理工大學(xué)重慶創(chuàng)新中心副主任。近年來帶領(lǐng)其科研團(tuán)隊圍繞光電成像探測與識別、計算成像和人工智能等領(lǐng)域不斷深化研究。主持承擔(dān)國家自然科學(xué)基金委重大科研儀器研制項目等40余項。在國際、國內(nèi)等系列期刊發(fā)表學(xué)術(shù)論文200余篇,其中被SCI/EI收錄120余篇。以第一發(fā)明人申請國家發(fā)明專利87項,已授權(quán)和公示45項。獲省部級科技進(jìn)步二等獎等獎項3項。指導(dǎo)研究生獲得中國圖象圖形學(xué)學(xué)會優(yōu)秀博士學(xué)位論文,二人次獲得王大珩高校學(xué)生光學(xué)獎,三人次獲得全國光學(xué)與光學(xué)工程博士生學(xué)術(shù)聯(lián)賽全國百強(qiáng),獲得中國高等教育博覽會“校企合作 雙百計劃”典型案例和重慶英才創(chuàng)新創(chuàng)業(yè)示范團(tuán)隊等榮譽(yù)稱號。
分享到:
