CVPR 2020 | 元學習人臉識別框架詳解

2020-05-15   AI科技評論

原標題:CVPR 2020 | 元學習人臉識別框架詳解

本文介紹的是CVPR2020 oral論文《Learning Meta FaceRecognition in Unseen Domains(MFG[1])》,作者來自明略科技集團明略科學院與中科院自動化研究所。

者 | 明略科技

編輯 | 叢 末

論文地址:https://arxiv.org/abs/2003.07733

1

導語

人臉識別系統通常在現實應用中面臨著未知域的挑戰,由於泛化能力差而表現出不令人滿意的性能。例如,在Webface數據集上訓練有素的模型無法處理安防領域中人證比對的任務。在本文中,旨在學習一種通用模型,該模型可以直接處理新的未知域,無需對模型進行更新。

為此,作者團隊提出了一種通過元學習的新型人臉識別方法,稱為元人臉識別(MFR)。MFR使用一個元優化目標針對源/目標域的偏移量,這需要模型不僅可以很好的表征源域,而且還很好地表征目標域。具體而言,通過跨域採樣策略構建多域組合的批次,並通過優化多域分布在源/目標域上獲得反向傳播的梯度/元梯度。將梯度和元梯度進一步結合以更新模型以提高泛化性。此外,我們提出了兩個用於人臉識別的測試標準。在測試標準上,驗證了與其他SOTA方法相比MFR具備很高的泛化能力。

2

簡介

針對未知域(Unseen domain)的泛化人臉識別問題:在目標場景未知的條件下,如何設計一個有效的訓練策略或方法,讓模型不需要微調更新或者重新訓練就能在未知場景下取得較好的泛化能力。作者團隊提煉出了generalized face recognition問題。值得一提的是,作者團隊在AAAI2020上發表的一篇關於人臉防偽的工作AIM-FAS[2] 上也驗證了Meta-learning在解決該類問題上具有很好的效果,作者團隊首次將元學習應用到人臉識別與人臉防偽這兩個應用領域,很有意義。

本篇論文的主要貢獻在於首先提出了generalized face recognition這一問題,這個問題在工業界中十分常見,不僅具備科研價值而且具備落地價值;其次,為了解決generalized face recognition問題,作者團隊提出了基於元學習的MetaFace Recognition(MFR)框架,將元優化引入到訓練過程中,使模型的泛化能力得到了很明顯的提高;最後為了將generalized face recognition問題進行量化,並評估MFR與一些其他方法對解決這一問題的能力,作者團隊提出了兩個新的benchmark,提供了全新的測試標準。

3

方法

首先介紹一下generalized face recognition問題,因為人臉識別模型通常部署在未知情況下並且從未見過的數據,因此這種情況更為普遍,所以稱為「廣義人臉識別問題」。如下圖所示,部署的模型應該能夠推廣到未知的域,並且無需任何做任何更新、微調或者重新訓練。

Meta Face Recognition:

針對泛化人臉識別問題,我們提出了一種基於元學習的人臉識別框架MFG(Meta Face Recognition)。MFR主要包括三部分:(1)跨域採樣;(2)多域分布優化;(3)元優化。整體的框架下圖所示:

首先,跨域採樣是為了模擬訓練場景和測試場景的分布偏差,每次疊代時,根據訓練集的域標籤,將訓練集分為元訓練域和元測試域,並在兩個域中分別採樣一定人數。其次,在多域分布優化中,我們使用了三種損失函數,包括難樣本損失、軟分類損失和域對齊損失,來學習具有判別性和域不變性的人臉表征。最後,元優化通過三個步驟對模型進行優化,(1)元訓練:對元訓練域進行優化,並得到梯度更新後的模型參數;(2)元測試:在元測試域上,對元訓練更新後的模型參數進行二次更新;(3)對元優化和元測試的損失進行加權,對原始模型的參數進行梯度反傳更新。元優化的示意圖如下圖所示:

Domain Alignment Loss:

作者團隊在實驗中發現跨元訓練域的負對往往比域內的對容易。通過添加域對齊正則化以使映射特徵域不變,我們可以減少不同元訓練域的域間隙。此外,使跨元訓練域的負樣本對變得更加困難,這對於學習更多區分性表示是有益的。為了執行域對齊,我們使多個元訓練域的均值映射特徵彼此接近。具體來說,我們首先計算元訓練域的所有均值映射特徵的中心,然後優化所有均值映射特徵與該特徵中心之間的差異。域對齊損失函數僅適用於元訓練域,因為元測試域中僅包含一個域。損失函數的公式如下:

其中,是歸一化特徵,是從域 中批量採樣的平均特徵,是元訓練域中所有均值映射特徵的的特徵中心,n是元訓練域的數量,s是縮放因子。在元優化中,我們將自適應地利用domain aligment loss與其他兩種損失函數的反向傳播信號來一起改善模型的通用性。

4

實驗

為了驗證模型的泛化性,我們提出了兩個不同難度的測試協議,如下表所示。一個是跨種族(印度人、非洲人、亞洲人,高加索人)測試協議GFR-R;另一個是跨場景測試協議GFR-V,其更接近實際場景,也更具挑戰性。在協議中,目標域的數據在訓練中是未知的,用於模擬未知的應用場景。

表1. GFR-R跨人種測試協議和GFR-V跨域測試協議

通過表2可以看出,通過元學習,本方法在跨種族和跨場景的測試中均取得了最好的性能。可以看到MFR的模型泛化能力是很強的,這種訓練框架很適用於跨域的應用場景。

表2. GFR-R跨人種測試協議和GFR-V跨域測試協議結果。

5

總結

Generalized face recognition問題還很值得挖掘,並且MFR也依然有可以提升性能的空間。在工業界中,使用MFR的方式去做人臉識別模型的訓練,相比之前的方法,在面對新的場景上,表現會有所提升。

Reference:

[1] JianzhuGuo et al., Learning Meta Face Recognition in Unseen Domains, CVPR2020 (Oral)

[2]Yunxiao Qin et al., Learning Meta Model for Zero- and Few-shot FaceAnti-spoofing, AAAI2020 (Spotlight)