深度融合,創新發展——信息學院在人工智能領域取得豐碩成果

ON2020-04-28文章來源 信息科學與技術學院CATEGORY新聞

近幾年,隨著人工智能的創新成果與經濟社會各領域的深度融合,人工智能已逐漸成為賦能實體經濟高質量發展的新動能,作為傳統產業改造升級的“助推器”影響著人們的生產與生活方式。今年剛過去4個月,我校信息學院視覺與數據智能中心就有29篇論文被國際頂尖會議接收,論文主題覆蓋了包括計算機視覺、機器學習、自然語言處理、計算機圖形學以及多智能體系統的研究熱點,致力于解決包括數字娛樂、建筑設計、交通監控和控制、醫學成像以及數字經濟等生活中的各類問題。

信息學院視覺與數據智能中心成員合影

計算機視覺技術的發展,就好比人工智能不斷進化的雙眼,為無人駕駛載具這個熱門領域奠定了堅實的基礎。Laurent課題組針對車載環視相機系統的優化以及車輛位姿估計方法的優化進行了研究,提出了相應的算法及優化策略,并在特定的場景下驗證了其有效性。為了解決多視圖幾何中的魯棒模型擬合問題,Manolis課題組和Laurent課題組提出了使用對偶主成分分析(DPCP)的方法作為隨機采樣一致(RANSAC)方法的有效替代,在真實數據上的實驗證明了該方法在確保高水平的擬合性能的同時,將運行時間縮短了一個數量級。為了解決“無對應點線性回歸”問題,Manolis課題組嘗試用代數幾何的方法,通過線性回歸擬合給定數據集來應對樣本和觀測量之間的未知的對應關系。以上研究多篇論文被國際計算機視覺與模式識別會議(CVPR)、IEEE機器人與自動化國際會議(ICRA)所接收。

隨著深度神經網絡技術的快速發展,人工智能正被廣泛應用于醫學影像分析。通過引入人工智能算法提高對醫學影像分析的精度,可以為疾病的準確診斷和有效治療提供必要支持。為了提高疾病分類和篩查的圖像可視性,高盛華課題組提出了無監督的感知輔助對抗適應網絡來對不同域的光學相干斷層掃描(OCT)圖像進行脈絡膜分割,該方法在源域和目標域上都取得了很好的效果,消除了域差異對脈絡膜分割性能的影響;提出一種創新的基于數據生成來解決開集(Open-set)問題的模型;采用神經網絡自編碼器對已知類別分布進行建模,并在已知類別分布邊緣采樣生成數據的策略;提出一種用于多任務學習的特征分離和聯合網絡來同時診斷糖尿病性視網膜病變和糖尿病性黃斑水腫。以上論文成果極大地節省了時間、精力、成本,減輕臨床醫生的負擔。文章被IEEE生物醫學成像國際會議(ISBI)所接收。

糖尿病性視網膜病變和糖尿病性黃斑水腫的眼底彩色圖

計算機視覺不僅在交通以及醫學領域發揮著重要的作用,在建筑設計、安全監視以及數字娛樂方面的發展也不容小覷。為了讓計算機視覺擁有像人類眼睛一樣的三維感知,計算機視覺正在“識別”的基礎上,走向 “三維重建”。高盛華課題組從建模的效率、建模的結構等方面不斷地做嘗試。他們針對多視角立體重建任務進行研究,提出了一種從稀疏到稠密的重建框架,提高了重建的效率。為了解決360°圖片中室內場景下的深度估計問題,提出了一種基于幾何結構的模型;為了預測目標行人的運動軌跡,提出了一種新穎的用于行人軌跡預測的高階圖卷積網絡(GCN)結合GCN進行高階交互式建模。虞晶怡課題組主要采用渲染方法來實現自由視角下三維人物的高質量重建與渲染。他們提出了一種端到端的動態人物渲染方法(NHR),可重打光神經渲染方法,分別實現了自由視角下的三維人物視頻效果以及基于單光照多視角圖片作為輸入的視角合成和重打光。他們還提出針對人臉的自標定近光源彩色光度立體重建方法,利用3D可變形模型提供的人臉幾何先驗進行近點光源的自標定,同時結合了人臉反照率分布特性提高重建精度。以上論文被CVPR以及IEEE計算攝影學國際會議(ICCP)所接收。

可重打光神經渲染的網絡框架

除了計算機視覺以外,還有許多研究人員致力于探索人工智能在多智能體系統決策方面的強大能力。為了在少樣本情況下主動探索任務,何旭明課題組提出了一種元強化學習的新穎策略,設計了一個基于圖神經網絡的任務推斷機制,可以對新任務進行快速適應。趙登吉課題組則率先嘗試將傳統算法博弈論的研究與社交網絡相結合,利用社交關系驅動解決全球數字經濟環境下的新挑戰,從科學的角度提出創新模型,以服務中國快速發展的數字經濟。他們解決基于社交網絡的廣告、資源分配、任務眾包等數字經濟新模型下的反欺詐設計,包括利用社交網絡進行更有效的資源分配/商品銷售,在有限資源的限制下將內容通過社交網絡分享給更多人,或者通過社交網絡結合眾包機制有效獲取一個任務的答案。以上科研成果被國際人工智能會議(IJCAI)、智能體及多智能體系統國際會議(AAMAS)和歐洲人工智能會議(ECAI)所接收。

自然語言處理研究如何讓計算機自動理解和生成人類語言,是人工智能領域的主要方向之一。屠可偉課題組著重研究語言內在結構(諸如詞性序列、句法、語義)的自動學習,特別是在缺少人工標注的低資源場景下的無監督和半監督學習。他們提出了一種基于條件隨機場自編碼器的模型,通過從句子預測語義依存結構、再試圖從這種結構重建句子的學習方式,半監督地學習語義依存分析器。同時,他們針對近期較為熱門的無監督成分句法分析方向,提出了規范化的實驗設定,并據此比較了多個傳統方法和深度學習方法,發現深度學習方法相對于傳統方法并無明顯優勢。此外,他們與阿里巴巴達摩院合作提出了結構層級的知識蒸餾技術,用于學習可以同時處理多門語言的序列標注模型。最后,在語言生成方向,他們與加州大學洛杉磯分校的合作者對開放領域對話生成的自動評價進行了深入研究。以上多篇論文被國際計算語言學協會年會(ACL)所接收。何旭明課題組為了進一步消除視覺定位中的歧義問題,設計了一個跨模態圖匹配策略來解決多短語下的視覺定位任務,包含了language- context graph以及 visual-context graph兩個主要的模塊。該論文被AAAI(美國人工智能年會)所接收。

視覺定位定性結果

信息學院視覺與數據智能中心致力于建立新一代人工智能體的基礎理論和應用探索。中心在理論研究上將大力推動感知模塊、學習算法、常識推理和仿真模擬的結合,突破單個AI領域的局限,從感知到決策的各個層面提出新的智能體理論框架;深入探索機器智能與人類智能的協同發展和相互增強,建立人類與機器智能的交互合作的理論基礎和實驗平臺;在此基礎上,建立跨學科人工智能的應用基礎,通過結合基礎科學,設計管理和藝術創造等方面對人工智能的應用場景進行大范圍地擴展,促進上述學科在人工智能方法協助下實現創新性理論的快速迭代和發展。