當前位置:首頁 > 新聞中心 > 科研動態

科研動態

自動化所攬獲2019國際計算機視覺大會7項競賽大獎

  • 发表日期:2019-11-07 【 【打印】【關閉】
  •   近日,兩年一度的計算機視覺大會ICCV 2019International Conference on Computer Vision)在韓國首爾落幕,自動化所同時攬獲7項競賽大獎,包括5項冠軍和2項亞軍。 

      智能感知與計算研究中心俞宏遠聯合微軟亞洲研究院在VOT2019-RGBD跟蹤挑戰賽中奪得了冠軍。Visual-Object-Tracking Challenge (VOT)是國際目標跟蹤領域最權威的測評平台,旨在評測在複雜場景下單目標跟蹤的算法性能。其中VOT-RGBD競賽所使用的數據集是目前國際公開數據集中挑戰最大的RGBD跟蹤數據集,該數據集中包含了跟蹤目標形狀變化、遮擋、消失後再出現以及黑暗環境下的目標跟蹤等諸多挑戰。我們使用的SiamDW-D跟蹤模型,融合了RGB和深度兩種模態的數據,賦予了傳統跟蹤模型處理多種模態數據和在線更新的能力。因此,在跟蹤過程中能更好地適應跟蹤環境和跟蹤目標的變化,實現了在複雜場景下的高精度魯棒跟蹤。 

      智能感知與計算研究中心牛凱等人在WIDER Face and Person Challenge 2019基于自然語言信息的行人檢索Person Search by Language任務中獲得冠軍。基于自然語言信息來檢索大規模數據集中的行人圖片是一項重要且極具挑戰性的任務。在很多場景下,我們並不能得到可靠的待搜索對象的視覺信息。比賽所用測試數據與訓練數據來自完全不同的真實監控場景,將該任務向實際應用推進了一大步,同時也對模型提出了更高的挑戰。我們的模型不僅能夠很好的處理自然語言和視覺信息間巨大的模態差異進行准確檢索,同時能夠克服真實監控場景下的跨領域難題,極大的提升了檢索的准確性,在獲得競賽冠軍的同時得分遠超其他參賽隊伍,在智能安防、零售、智慧城市等場景中均具有巨大的應用前景。 

      生物識別與安全技術團隊劉浩、朱翔昱、雷震等人在Light Weight Face Recognition ChallengeLFR)大規模圖像人臉識別賽道中獲得冠軍。經過近幾年深度學習的發展,人臉識別技術已經在學術界衆多人臉測試集上的性能達到飽和,但是在實際應用場景中仍有許多問題亟待解決,尤其是大規模人臉識別和視頻人臉識別問題。ICCV2019 Light Weight Face Recognition ChallengeLFR)競賽便是針對這些問題舉辦的人臉識別挑戰賽。在大模型圖像人臉識別賽道(DeepGlint-Large)上,團隊使用改進的SE-AttentionNet-IR作爲基礎架構,使用CosFace作爲損失函數並重點調整了margin,最終在有限的計算資源下戰勝了衆多參賽企業取得該賽道的冠軍。並受邀到會議現場作題爲“High Performance Face Recognition without Bells and Whistles”的口頭報告。 

      視頻內容安全團隊張子琦、史雅雅、魏久桐、原春鋒、李兵、胡衛明在視頻描述競賽VATEX Captioning Challenge中獲得中英文雙料冠軍。本項比賽分爲中文描述和英文描述兩個賽道。視頻描述涉及到計算機視覺和自然語言處理兩個領域,有表觀、運動、語義屬性甚至語音等多個模態。因此,如何更好地融合多模態信息,成爲本次比賽的最大挑戰。團隊在沒有大量樣本訓練的前提下,采取恰當的訓練方式,依靠堅實的技術積累在中英文描述兩個賽道均獲冠軍。 

      圖像與視頻分析團隊程健、冷聰、張一帆等在輕量級人臉識別比賽Light Weight Face Recognition Challenge和快速人臉識別Face Detection Runtime中分別獲得亞軍。Light Weight Face Recognition ChallengeWINDER CHALLENGE Face Detection Runtime Challenge兩項比賽是針對真實應用場景,在要求模型准確度同時,還分別重點關注模型的體積和檢測速度。比賽所用數據集是目前國際公開的數據規模最大、真實度最貼近實際(數據來自真實場景)、檢測難度最高的人臉識別檢測數據集。我們的人臉識別模型,在模型精度、體積和速度上取得了突破,不但達到了高精度,還極大地降低了模型計算量和模型體積,實現了超高性能,在安防、金融、物聯網等各種實際人臉識別場景,尤其在AIoT邊緣計算場景中有著廣闊的應用潛力。