前兩天,一則「億萬富翁找回失散 25 年兒子」的話題引起了全網關注。
1998 年,年僅 3 個月大的解清帥被人偷走。他的父親一直苦苦找尋,終於在 25 年後父子一家團聚。
這次解清帥能夠一家團聚,離不開一家做人臉識別的公司。公司的「跨年齡同親緣人臉比對算法」通過分析解清帥父母加上哥哥的面部圖像,就匹配到了解清帥,最終通過 DNA 對比,確認了解清帥的身份。
圖源:新浪微博截圖
問題來了:尋找解清帥的人臉識別技術究竟是怎麼一回事?跟我們解鎖手機時候用到的是同一種技術嗎?今天就來說一說人臉識別的前世今生。
從人工輔助到純計算機識別
1
用身體特徵定義一個人
早在 1879 年,法國犯罪學家阿方斯·貝蒂榮(Alphonse Bertillon)就發明了一套用來識別罪犯或者犯罪嫌疑人的方法:通過測量 11 項身體數據,比如手肘到中指末端、右耳的長度、左腳的長度等等,來識別一個人。
阿方斯的人體特徵識別方法,圖片來源:wikimedia
雖然阿方斯的初衷是為了識別壞人,但他這種根據身體數據特徵來識別一個人的思想,對於之後的人臉識別技術有很大的啟發。
2
「半自動」人臉識別
在 1964 年,美國數學家、人工智慧專家伍迪·布萊索(woodrow bledsoe)等人開始嘗試用計算機識別人類照片。最初的想法是從不同角度去拍攝人臉的照片,然後讓計算機學習這些照片上的明暗數據來識別一張臉。但考慮當時的技術限制,這個思路根本行不通。
最終,伍迪等人選擇了類似於阿方斯的方法,從人臉上尋找大約 20 個特徵,比如眼睛的寬度和間距、耳朵的長度、嘴角的長度等等,通過測量這些特徵的數值,來定義一個人。
不過當時的計算機還沒法直接從照片上測量這些數據,伍迪只好設計了一個軟體,由人手動把測量的數據輸入進計算機,計算機再將它們與資料庫中的數據進行比對,識別出這張臉屬於誰。
這算得上是最早的人臉識別軟體了,但這是個需要人類參與的「半自動」方法,每小時只能處理 40 張圖片。
3
全自動人臉識別
在二十世紀70年代,日本科學家金出武雄展示了一種新的人臉識別軟體。這款軟體能夠自動定位下巴的位置,從而自動測量人臉的數據,自動進行識別。
雖然這款軟體依然會受到拍攝角度、光線陰影等因素的影響,識別準確率有限,但它實現了從「半自動」到「全自動」的重要轉變。
在之後的二十世紀八、九十年代,Eigenfaces、Fisherfaces 等方法出現,讓全自動人臉識別技術有了顯著進步,對於受控環境下的靜態照片(比如證件照)識別能力已經比較可靠了。
比如,美國的西維吉尼亞州、新墨西哥州都採用了面部識別技術來識別駕照上的人臉,防止同一個人用不同名字辦理多份駕照。在 1997 年,美國的明尼蘇達州也開始用面部識別系統來識別州內罪犯。
4
卷積神經網絡帶來飛躍
在 2010 年前後,基於卷積神經網絡的深度學習技術,讓人臉識別技術再出現飛躍。
卷積神經網絡是一種模仿生物視覺建立的神經網絡,它本身的架構就非常擅長處理圖像信息。人們在卷積神經網絡基礎上進行各種優化,能夠根據需要提取出畫面上不同類型的信息,比如光線明暗,線條輪廓等等,從而對圖片做出綜合判斷。
人臉識別系統,圖片來源:參考文獻 [2]
這種方式跟前面阿方斯的方法已經有一些區別了,不再是根據眼睛寬度、耳朵長度等特定數字來識別人臉,而是直接從人臉整體特徵來識別,更類似於動物視覺的識別過程。
在2010年前後,能夠供深度神經網絡訓練的計算機視覺資料庫也日趨完善,比如李飛飛等人構建的 ImageNet,裡面包含上千萬手動注釋過的圖片。再加上 2012 年前後 GPU 被應用到深度學習領域,人臉識別技術的速度和準確率都得到了極大的提升。
比如,2014 年 FaceBook 的 DeepFace 人臉識別系統已經能達到 97.35% 的準確率,跟人類的識別準確率相差無幾。而谷歌在 2015 年提出的 FaceNet,在一些資料庫里的人臉識別準確率更是達到了 99.63%。
Deepface人臉識別系統,圖片來源:參考文獻 [3]
到了今天,人臉識別技術依然在飛速發展,除了能識別靜態照片,對於視頻畫面中的動態人臉也能做到準確快速地識別。
無處不在的人臉識別技術
隨著人臉識別的準確率越來越高,在生活中的應用也越來越多。
比如,現在主流的手機幾乎都能支持刷臉解鎖;在很多便利店裡買東西已經可以不用掏出手機打開支付碼了,直接刷臉支付就可以;在進出火車站的時候,也可以直接刷臉通過閘機口。
除了這些日常應用,人臉識別系統還在一些特殊領域發揮重要作用。
比如,自 2018 年 4 月起,在張學友演唱會上,安檢、監控攝像頭就成功抓拍到了將近 100 名逃犯或犯罪嫌疑人,網友也調侃張學友的演唱會簡直就是「緝拿會」。
另外,在社會範圍內引起比較大爭議的勞榮枝案中,人臉識別系統也輕鬆識別出了潛逃 23 年之久的勞榮枝。
圖源:廈門警方視頻截圖
隨著人臉識別技術在跨年齡人臉識別、面部有遮擋情況下的人臉識別準確率越來越高,人臉識別技術也能更好地守護我們的安全。
前面提到的「跨年齡同親緣人臉對比算法」,也是對於人臉識別技術在特定領域的優化。這樣的功能不僅能夠在多年之後尋找到潛逃的犯罪嫌疑人,同時對於走失或者被拐賣的兒童尋找親生父母有非常大的幫助。
基於親屬關係的面部識別系統,圖片來源:參考文獻 [4]
值得關注的是,雖然 AI 人臉識別給我們的生活帶來了便利,也守護著我們的安全,但它同樣存在著一些風險。
比如手機有一些 App 在使用我們的面部數據,雖然大部分公司會盡力確保這些數據的安全,但依然存在一些軟體開發商沒有能力或者壓根就沒打算保護數據安全性,這可能會造成嚴重的個人信息泄露事件。
比如,向美國執法機構提供服務的 Clearview AI 公司就曾經被曝出過數據泄露事件。另外,該公司也被曝出在未經用戶同意的情況下非法搜集用戶照片信息用訓練算法。
總之,人臉識別技術雖然已經有半個多世紀的歷史,但它真正進入高速發展階段,滲透到生活的各個領域也只是最近十年左右的事情。
人臉識別技術用在正確的地方,確實給我們的生活帶來便利和安全,也讓失散多年的家庭得以團聚。
但在享受技術發展便利的同時,我們也要增強自己的隱私意識,儘量避免在不知名的小程序上使用自己的照片、視頻,減少信息泄露的可能性。
參考文獻
[1]Adjabi I, Ouahabi A, Benzaoui A, et al. Past, present, and future of face recognition: A review[J]. Electronics, 2020, 9(8): 1188.
[2]王亮,黃永禎,張凱皓. 一種基於卷積神經網絡的人臉親屬關係識別方法及裝置,CN105005774A,2019-02-19
[3]Taigman Y, Yang M, Ranzato M A, et al. Deepface: Closing the gap to human-level performance in face verification[C]//Proceedings of the IEEE conference on computer vision and pattern recognition. 2014: 1701-1708.
[4]Robinson J P, Shao M, Wu Y, et al. Families in the wild (fiw): Large-scale kinship image database and benchmarks[C]//Proceedings of the 24th ACM international conference on Multimedia. ACM, 2016: 242-246
策劃製作
本文為科普中國-星空計劃作品
出品|中國科協科普部
監製|中國科學技術出版社有限公司、北京中科星河文化傳媒有限公司
作者丨科學邊角料 科普創作團隊
審核丨於暘 騰訊玄武實驗室負責人
策劃丨林林
責編丨林林