北理工團(tuán)隊(duì)在人工智能圖像識別領(lǐng)域取得新進(jìn)展
發(fā)布日期:2023-10-20 供稿:光電學(xué)院 攝影:光電學(xué)院
編輯:盛筠 審核:董立泉 閱讀次數(shù):深度學(xué)習(xí)作為新一代人工智能的核心技術(shù),,依賴于大規(guī)模的標(biāo)注數(shù)據(jù)自動學(xué)習(xí)知識,。然而,現(xiàn)實(shí)世界中的數(shù)據(jù)面臨著標(biāo)注噪聲和數(shù)據(jù)分布不平衡(長尾)等科學(xué)挑戰(zhàn),,這些問題嚴(yán)重影響了訓(xùn)練模型的性能,。近期,北京理工大學(xué)光電學(xué)院的許廷發(fā)教授科研團(tuán)隊(duì)在長尾數(shù)據(jù)下的理論模型研究方面取得了突破性進(jìn)展,。相關(guān)研究成果以“Dynamic Loss For Robust Learning”為題,,發(fā)表在國際頂級期刊《IEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI)》上。IEEE TPAMI是人工智能,、模式識別,、圖像處理等領(lǐng)域的頂級權(quán)威期刊,其影響因子高達(dá)23.6,同時也是中國計(jì)算機(jī)協(xié)會 (CCF) 推薦的人工智能領(lǐng)域A類期刊,。
論文第一作者為北京理工大學(xué)江慎旺博士后和李佳男副研究員,,通訊作者是北京理工大學(xué)許廷發(fā)教授。
針對智能圖像識別任務(wù)的噪聲和長尾數(shù)據(jù)訓(xùn)練模型不理想難題,,許廷發(fā)科研團(tuán)隊(duì)首次提出和構(gòu)建了元學(xué)習(xí)自適應(yīng)魯棒的數(shù)理模型,。模型主要通過引入全新的動態(tài)損失函數(shù),主動感知數(shù)據(jù)分布和訓(xùn)練狀態(tài),,自適應(yīng)地動態(tài)修正數(shù)據(jù)標(biāo)注噪聲以及調(diào)整識別的類間距離,,實(shí)現(xiàn)了在長尾噪聲數(shù)據(jù)下的魯棒學(xué)習(xí)。
圖1 元學(xué)習(xí)自適應(yīng)魯棒的數(shù)理模型
圖2展示了分類間隔和特征分布隨訓(xùn)練時間的變化圖,。隨著訓(xùn)練過程的推進(jìn),,間隔生成器主動學(xué)習(xí)分類難度,自適應(yīng)增大長尾類別的間隔系數(shù),,如圖2類別10(折線圖標(biāo)紅部分),。模型生成了清晰的類別邊界,,如圖2中的特征分布變化圖,,顯著提升了模型應(yīng)對長尾噪聲數(shù)據(jù)的魯棒性。
圖2 分類間隔(上)和特征分布(下)隨訓(xùn)練時間的變化圖
論文提出的數(shù)理模型對元學(xué)習(xí)在圖像識別領(lǐng)域的應(yīng)用提供理論基礎(chǔ),,其實(shí)驗(yàn)結(jié)果對實(shí)際環(huán)境的智能圖像識別具有重要意義,。
論文詳情:S. Jiang, J. Li, J. Zhang, Y. Wang and T. Xu, "Dynamic Loss For Robust Learning," in IEEE Transactions on Pattern Analysis and Machine Intelligence, doi: 10.1109/TPAMI.2023.3311636.
論文鏈接:https://ieeexplore.ieee.org/abstract/document/10238823
附作者簡介:
江慎旺,北京理工大學(xué)光電學(xué)院博士后,。2014年,、2020年分別獲得北京理工大學(xué)學(xué)士、博士學(xué)位,,研究方向?yàn)闄C(jī)器學(xué)習(xí)和計(jì)算機(jī)視覺,。在國際頂級會議AAAI、IEEE等期刊發(fā)表學(xué)術(shù)論文16篇,,谷歌學(xué)術(shù)總引用量98次,,第一作者4篇,申請中國發(fā)明專利1項(xiàng),。曾獲得2021年ICCV第二屆反無人機(jī)國際挑戰(zhàn)賽(The 2nd Anti-UAV Workshop & Challenge)冠軍及該Workshop的最佳論文,,大學(xué)生數(shù)學(xué)競賽二等獎(北京市)、大學(xué)生物理競賽二等獎(北京市)等榮譽(yù),。
李佳男,,博士,北京理工大學(xué)光電學(xué)院預(yù)聘助理教授(特別副研究員),,新加坡國立大學(xué)博士后,。主要從事光電成像目標(biāo)探測與識別等方面的研究,主持國家自然科學(xué)基金等項(xiàng)目5項(xiàng)。以第一/通訊作者在IEEE TPAMI,、CVPR等頂級期刊或會議上發(fā)表學(xué)術(shù)論文60余篇,,ESI高被引論文1篇,谷歌學(xué)術(shù)總引近4000次,。入選中國科協(xié)及北京市科協(xié)“青年人才托舉工程”項(xiàng)目,,獲得中國圖象圖形學(xué)學(xué)會優(yōu)秀博士學(xué)位論文,王大珩光學(xué)獎等榮譽(yù),。指導(dǎo)學(xué)生獲得ICCV 2021“反無人機(jī)跟蹤”挑戰(zhàn)賽國際冠軍及最佳論文獎,、中國高等教育博覽會“校企合作雙百計(jì)劃”典型案例等。研究成果在“中國天眼”等國家重大科技基礎(chǔ)設(shè)施中得到重要應(yīng)用,。
許廷發(fā),,博士,教授/博導(dǎo),,國家一級重點(diǎn)學(xué)科“光學(xué)工程”學(xué)科責(zé)任教授,,光電成像技術(shù)與系統(tǒng)教育部重點(diǎn)實(shí)驗(yàn)室主任,北京理工大學(xué)重慶創(chuàng)新中心智能化和大數(shù)據(jù)技術(shù)實(shí)驗(yàn)室主任,。近年來帶領(lǐng)其科研團(tuán)隊(duì)圍繞光電成像探測與識別,、計(jì)算成像和人工智能等領(lǐng)域不斷深化研究。主持承擔(dān)國家自然科學(xué)基金委重大科研儀器研制項(xiàng)目等40余項(xiàng),。在國際,、國內(nèi)等系列期刊發(fā)表學(xué)術(shù)論文170余篇,其中被SCI/EI收錄90余篇,。以第一發(fā)明人申請國家發(fā)明專利45項(xiàng),,已授權(quán)和公示15項(xiàng)。獲省部級科技進(jìn)步二等獎等獎項(xiàng)3項(xiàng),。指導(dǎo)研究生獲得中國圖象圖形學(xué)學(xué)會優(yōu)秀博士學(xué)位論文,,二人次獲得王大珩高校學(xué)生光學(xué)獎,二人次獲得全國光學(xué)與光學(xué)工程博士生學(xué)術(shù)聯(lián)賽全國百強(qiáng),,獲得中國高等教育博覽會“校企合作雙百計(jì)劃”典型案例和重慶英才創(chuàng)新創(chuàng)業(yè)示范團(tuán)隊(duì)等榮譽(yù)稱號,。
分享到: