一種簡單而智能的方法：Python也能進行面部識別

2020-07-30 讀芯術

全文共2841字，預計學習時長8分鐘

圖源：unsplash

本文將介紹圖像處理中的一些重要概念，除了具體解釋每個步驟之外，還將提供一個在Python中使用Cv2和DLib庫輕鬆進行人臉識別的項目。

感興趣區域

在使用圖像進行面部分析時，最重要的概念之一是定義感興趣區域（ROI），我們必須在圖像中定義一個特定的部分，在那裡篩選或執行一些操作。

例如，如果我們需要篩選汽車的車牌，我們的感興趣領域只停留在車牌上，那麼街道、車身和圖片中出現的任何東西都只是輔助部分。在本例中，我們將使用opencv庫，該庫支持對圖像進行分區並幫助我們確定感興趣領域。

Haar庫

本項目中將使用現成的分類器：級聯的Haar分類器，這種特定的分類器將始終適用於灰度圖像。

該算法生成了一個幾何圖形，該幾何圖形將識別與我們所分析的相似點。因此在本例中，它將嘗試尋找人臉圖案，即眼睛、鼻子和嘴巴。這種分析方法最大的問題是產生幻想性視錯覺。

圖源：unsplash

你看到的是人眼還是幾扇窗戶？在希臘詞源學中，幻想性視錯覺是一種人類的特徵。從童年起，我們的大腦就被編程來識別物體、圖像中的人臉。利用我們先前獲得的經驗，我們自己的大腦會根據我們所認識到的「人類」特徵來尋找一種模式，增加新的人臉面孔。

使用Haar人臉特徵分類器

用以下圖像為例：

來看看識別這張圖片中的人臉代碼：

import cv2 group_of_people_image = cv2.imread('images/image7.jpg') frontal_face_classifier = cv2.CascadeClassifier('classifier/haarcascade_frontalface_default.xml') image_in_gray_scale = cv2.cvtColor(group_of_people_image,cv2.COLOR_BGR2GRAY) faces = frontal_face_classifier.detectMultiScale(image=image_in_gray_scale,scaleFactor=1.3, minNeighbors=6) for (x_axis, y_axis, weight,height) in faces: cv2.rectangle(group_of_people_image,(x_axis, y_axis), (x_axis + weight, y_axis + height), (255, 0, 0), 2)

該算法將圖像轉換為灰度圖像，如前所述，這是分類器操作的一個基本步驟，然後我們使用dectedMultiScale函數搜索圖像中的人臉，並通過繪製矩形來顯示圖像的位置，當定位人臉時結果如下：

我們能夠準確地分析兩張出現的臉（採用矩形的方式將人臉框起來），有兩個人完全正面地露出他們的臉，人臉完全顯現，所以我們可以清楚地看到他的臉；另一個人只露出了面部的一部分，所以我們沒有得到準確的信息來確認這是一張完整的人臉。

面部特徵檢測

Dlib是一個擁有一些分類器的庫，可以幫助我們檢測人臉的某些部分，例如：眼睛、眉毛、鼻子和洋娃娃的區域。以下圖為例：

現在，使用算法來識別圖像中的面部特徵點：

import cv2 import dlib import numpy as np initial_image = cv2.imread('images/image9.jpg') initial_image_in_rgb = cv2.cvtColor(initial_image,cv2.COLOR_BGR2RGB) reference_image = initial_image_in_rgb.copy() classifier_path = dlib.shape_predictor('classifier/shape_predictor_68_face_landmarks.dat') frontal_face_detector = dlib.get_frontal_face_detector() rectangles =frontal_face_detector(initial_image,1) for k, d inenumerate(rectangles): cv2.rectangle(reference_image,(d.left(), d.top()), (d.right(), d.bottom()), (255, 255, 0), 2) landmarks = [] for rectangle in rectangles: landmarks.append(np.matrix([[p.x, p.y] for p inclassifier_path(reference_image,rectangle).parts()])) for landmark in landmarks: for index, point inenumerate(landmark): point_center = (point[0, 0], point[0, 1]) cv2.circle(reference_image,point_center, 3, (255, 255, 0), -1) cv2.putText(reference_image,str(index), point_center, cv2.FONT_HERSHEY_COMPLEX, 3, (255, 255, 255), 2)

我們使用的是人臉68個特徵分類器，它試圖更精確地理解點面，這給了我們更多的選擇去分析結果，其缺點是速度有點慢。所以必須劃定一個矩形來確定我們的臉可能在哪裡，特徵是我們可以識別的人臉特徵，包括臉、嘴、眼睛、眉毛。

一旦用矩形的方式框出了臉，就可以使用功能部件將這些特徵返回，最後將得到一些可視化的東西去生成一個帶有面部點的圖像。結果是：

這些點對於幫助識別表情很重要，例如我們可以識別出這個男孩睜著眼睛，閉著嘴巴。把這看作是一種情緒的表現，可以說這個男孩很焦慮。當一個人微笑時，它可以幫助理解這種情緒可能表達的是幸福。

上述例子向我們展示了，Python可以識別出我們感興趣的區域，在本文中就是人臉識別。這個項目還可以擴展到使用機器學習來檢測，探究圖像中的人是否感到快樂、悲傷或者憂慮。

包含所有內容的項目可從以下網址獲得：https://github.com/LimaGuilherme/facial-recognize

留言點贊關注

我們一起分享AI學習與發展的乾貨

如轉載，請後台留言，遵守轉載規範

一種簡單而智能的方法：Python也能進行面部識別

宇宙是否穩定？如果時間夠長，質子本身是否也會衰變？

全球首個「算法章程」：應對算法偏見，紐西蘭使出殺手鐧

參加頂級科技公司面試前需要掌握的10個基本算法

備戰解決方案架構師考試，你需要哪些知識和技能？

數據之美：可視化會給你意想不到的答案

ARM晶片取代Intel：這對iOS的開發人員意味著什麼？

GPT-3主導編程：最新的AI會扼殺編碼工作嗎？

如何定義和搭建可靠人工智慧系統的規則？

算法之「算法」：所有機器學習算法都可以表示為神經網絡

拋棄VS Code，轉向終端，我「移情別戀」的理由是什麼？

迷你器官的大作用：微型實驗室人腦揭示新冠影響

數據素養的7大判斷標準：看你骨骼清奇，來當數據科學家吧

數據科學終極求職指南：在這場較量中脫穎而出的藍海策略是？

顛覆已知：基礎物理學的下一次大革命將如何開啟？

不用再掐點兒搶號！遠程醫療帶來求醫新體驗

今日芯聲｜巴西副總統：不懼美方威脅，歡迎華為參與 5G 建設競標

這才是真正的共享！區塊鏈技術是如何幫助共享經濟崛起的？

疫情衝擊經濟放緩：我們需要全自動奢侈型共產主義

今日芯聲｜雷軍小米十周年：一碗滾燙的小米粥，開啟了沸騰的十年

軟體開發人員的「定投」：把知識當作生意來對待

一種簡單而智能的方法：Python也能進行面部識別

減少污染和溫室氣體排放，數據科學家在行動

態度決定與上限的距離：培養對數據科學的良好態度

25個最佳的VSCode擴展！帶你領略VSCode的獨特魅力