Python 利用 OpenCV抓取相片中的臉部數據

woff · 發表於 2021-11-23 22:52:45

為了將圖片數據轉換為適合 AI訓練的格式，利用 OpenCV先對臉部進行辨識，然後將臉部數據另存為統一的格式。

import cv2
face_cascade = cv2.CascadeClassifier('./cascades/haarcascade_frontalface_default.xml')
eye_cascade = cv2.CascadeClassifier('./cascades/haarcascade_eye.xml')
def detect(filename):
img = cv2.imread(filename)
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
faces = face_cascade.detectMultiScale(gray,
scaleFactor=1.2,
minNeighbors=3,)
for (x,y,w,h) in faces:
roi_gray = gray[y:y+h, x:x+w]
eyes = eye_cascade.detectMultiScale(roi_gray,
scaleFactor=1.02,
minNeighbors=3,
minSize=(40,40),)
img = cv2.rectangle(img,(x,y),(x+w,y+h),(255,0,0),2)
for (ex,ey,ew,eh) in eyes:
img = cv2.rectangle(img,(x+ex,y+ey),(x+ex+ew,y+ey+eh),(0,255,0),2)
cv2.imwrite('./tzuyu_face.jpg', img)
detect('tzuyu.jpg')

複製代碼

利用 cv2.CascadeClassifier導入辨識工具，其中選擇了臉部和眼睛的辨識工具。
讀取圖像數據後，轉為灰階，利用detectMultiScale做臉部和眼睛的辨識。
detectMultiScale中的數據參數分別是

利用 cv2.rectangle把辨識到的臉部或眼睛進行標注，參數依序是

第一個迴圈中先利用以辨識的臉部再進行眼睛的辨識。
其中 Haar級聯數據可以從這裡下載。裡面提供了各類辨識的工具。
另外也可以使用 LBP級聯數據，可以從這裡下載。

先試看看子瑜女神，有沒有辦法被辨識。

Python OpenCV 臉部數據

子瑜女神看來起來辨識滿成功的。
接著看看失敗的例子，用了同樣的參數辨識一下 Twice和愉快伙伴們？

Python OpenCV 臉部數據

看來挺失敗的，娜璉和其中兩位愉快伙伴完全沒有辨識出臉，眼睛的部份大多都沒有辨識成功。為了辨識成功，可能需要調整一下參數。至於如何避免 OpenCV混淆眼睛和嘴，本人目前沒有對策，求高手指點。不過還好團體照不是我要辨識的主要目標。
接著修改 detect，把辨識出的臉，另存為供 AI訓練的圖像。

import cv2
face_cascade = cv2.CascadeClassifier('./cascades/haarcascade_frontalface_default.xml')
eye_cascade = cv2.CascadeClassifier('./cascades/haarcascade_eye.xml')
face_filename = 1
def detect(filename):
img = cv2.imread(filename)
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
faces = face_cascade.detectMultiScale(gray,
scaleFactor=1.2,
minNeighbors=3,)
for (x,y,w,h) in faces:
roi_gray = gray[y:y+h, x:x+w]
eyes = eye_cascade.detectMultiScale(roi_gray,
scaleFactor=1.02,
minNeighbors=3,)
if len(eyes)>=2:
f = cv2.resize(gray[y:y+h, x:x+w], (200, 200))
global face_filename
name = './face/%d.png' % face_filename
cv2.imwrite(name, f)
face_filename += 1
else:
pass
print('Working with %s' % filename)

複製代碼

對臉部和眼睛進行辨識，至少辨識出兩隻眼睛(無論對錯)才進行儲存，輸出為 200x200的 png格式。
我沒有設定minSize，因為我的數據有點少解析度落差也很大，所以不想要太嚴格。

複製代碼

做法可能沒有很聰明，利用 os.walk把該資料夾中的各種格式的圖像名稱儲存成 list，再利用迴圈對圖像一個個辨識。
無論原圖解析度如何，全都會輸出統一的格式，輸出的圖像如下。

Python OpenCV 臉部數據

賬號		自動登錄	找回密碼
密碼			註冊

[教學] Python 利用 OpenCV抓取相片中的臉部數據