一種簡單而智能的方法:Python也能進行面部識別

2020-07-30   讀芯術

原標題:一種簡單而智能的方法:Python也能進行面部識別

全文共2841字,預計學習時長8分鐘

圖源:unsplash

本文將介紹圖像處理中的一些重要概念,除了具體解釋每個步驟之外,還將提供一個在Python中使用Cv2和DLib庫輕鬆進行人臉識別的項目。

感興趣區域

在使用圖像進行面部分析時,最重要的概念之一是定義感興趣區域(ROI),我們必須在圖像中定義一個特定的部分,在那裡篩選或執行一些操作。

例如,如果我們需要篩選汽車的車牌,我們的感興趣領域只停留在車牌上,那麼街道、車身和圖片中出現的任何東西都只是輔助部分。在本例中,我們將使用opencv庫,該庫支持對圖像進行分區並幫助我們確定感興趣領域。

Haar庫

本項目中將使用現成的分類器:級聯的Haar分類器,這種特定的分類器將始終適用於灰度圖像。

該算法生成了一個幾何圖形,該幾何圖形將識別與我們所分析的相似點。因此在本例中,它將嘗試尋找人臉圖案,即眼睛、鼻子和嘴巴。這種分析方法最大的問題是產生幻想性視錯覺。

圖源:unsplash

你看到的是人眼還是幾扇窗戶?在希臘詞源學中,幻想性視錯覺是一種人類的特徵。從童年起,我們的大腦就被編程來識別物體、圖像中的人臉。利用我們先前獲得的經驗,我們自己的大腦會根據我們所認識到的「人類」特徵來尋找一種模式,增加新的人臉面孔。

使用Haar人臉特徵分類器

用以下圖像為例:

來看看識別這張圖片中的人臉代碼:

import cv2 group_of_people_image = cv2.imread('images/image7.jpg') frontal_face_classifier = cv2.CascadeClassifier('classifier/haarcascade_frontalface_default.xml') image_in_gray_scale = cv2.cvtColor(group_of_people_image,cv2.COLOR_BGR2GRAY) faces = frontal_face_classifier.detectMultiScale(image=image_in_gray_scale,scaleFactor=1.3, minNeighbors=6) for (x_axis, y_axis, weight,height) in faces: cv2.rectangle(group_of_people_image,(x_axis, y_axis), (x_axis + weight, y_axis + height), (255, 0, 0), 2)

該算法將圖像轉換為灰度圖像,如前所述,這是分類器操作的一個基本步驟,然後我們使用dectedMultiScale函數搜索圖像中的人臉,並通過繪製矩形來顯示圖像的位置,當定位人臉時結果如下:

我們能夠準確地分析兩張出現的臉(採用矩形的方式將人臉框起來),有兩個人完全正面地露出他們的臉,人臉完全顯現,所以我們可以清楚地看到他的臉;另一個人只露出了面部的一部分,所以我們沒有得到準確的信息來確認這是一張完整的人臉。

面部特徵檢測

Dlib是一個擁有一些分類器的庫,可以幫助我們檢測人臉的某些部分,例如:眼睛、眉毛、鼻子和洋娃娃的區域。以下圖為例:

現在,使用算法來識別圖像中的面部特徵點:

import cv2 import dlib import numpy as np initial_image = cv2.imread('images/image9.jpg') initial_image_in_rgb = cv2.cvtColor(initial_image,cv2.COLOR_BGR2RGB) reference_image = initial_image_in_rgb.copy() classifier_path = dlib.shape_predictor('classifier/shape_predictor_68_face_landmarks.dat') frontal_face_detector = dlib.get_frontal_face_detector() rectangles =frontal_face_detector(initial_image,1) for k, d inenumerate(rectangles): cv2.rectangle(reference_image,(d.left(), d.top()), (d.right(), d.bottom()), (255, 255, 0), 2) landmarks = [] for rectangle in rectangles: landmarks.append(np.matrix([[p.x, p.y] for p inclassifier_path(reference_image,rectangle).parts()])) for landmark in landmarks: for index, point inenumerate(landmark): point_center = (point[0, 0], point[0, 1]) cv2.circle(reference_image,point_center, 3, (255, 255, 0), -1) cv2.putText(reference_image,str(index), point_center, cv2.FONT_HERSHEY_COMPLEX, 3, (255, 255, 255), 2)

我們使用的是人臉68個特徵分類器,它試圖更精確地理解點面,這給了我們更多的選擇去分析結果,其缺點是速度有點慢。所以必須劃定一個矩形來確定我們的臉可能在哪裡,特徵是我們可以識別的人臉特徵,包括臉、嘴、眼睛、眉毛。

一旦用矩形的方式框出了臉,就可以使用功能部件將這些特徵返回,最後將得到一些可視化的東西去生成一個帶有面部點的圖像。結果是:

這些點對於幫助識別表情很重要,例如我們可以識別出這個男孩睜著眼睛,閉著嘴巴。把這看作是一種情緒的表現,可以說這個男孩很焦慮。當一個人微笑時,它可以幫助理解這種情緒可能表達的是幸福。

上述例子向我們展示了,Python可以識別出我們感興趣的區域,在本文中就是人臉識別。這個項目還可以擴展到使用機器學習來檢測,探究圖像中的人是否感到快樂、悲傷或者憂慮。

包含所有內容的項目可從以下網址獲得:https://github.com/LimaGuilherme/facial-recognize

留言點贊關注

我們一起分享AI學習與發展的乾貨

如轉載,請後台留言,遵守轉載規範