Python如何使用opencv进行手势识别详解

  

Python如何使用OpenCV进行手势识别详解

手势识别被广泛应用于人机交互领域,Python的OpenCV库可以实现基本的手势识别。本文将详细介绍使用OpenCV库进行手势识别的完整攻略。

准备工作

安装OpenCV

首先需要安装OpenCV库,可以使用以下命令安装:

pip install opencv-python

下载数据集

我们需要一个训练数据集,这里使用的数据集是ASL数据集(美国手语字母)。可以在Kaggle网站上下载:https://www.kaggle.com/grassknoted/asl-alphabet

下载完毕后,需要将数据集解压到一个文件夹中。

图像预处理

对于手势识别,首先需要对图像进行预处理,以去噪和增加对比度。

import cv2

# 读取图像
img = cv2.imread('path/to/image')
# 转为灰度图
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
# 中值滤波
gray = cv2.medianBlur(gray, 5)
# 对比度增强
gray = cv2.equalizeHist(gray)

手势检测

对于手势检测,使用OpenCV库中自带的Haar特征分类器。这里我们使用了OpenCV的CascadeClassifier类,它可以加载Haar分类器来检测手势。

# 加载Haar分类器
face_cascade = cv2.CascadeClassifier('path/to/haar_classifier.xml')
# 检测手势
hands = face_cascade.detectMultiScale(gray, 1.3, 5)
for (x, y, w, h) in hands:
    cv2.rectangle(img, (x, y), (x + w, y + h), (0, 255, 0), 2)

手势识别

本文使用的是ASL字母手势识别,使用的是卷积神经网络(CNN)进行训练。这里为了简单起见,我们使用预训练模型。

# 加载模型
model = keras.models.load_model('path/to/model.h5')
# 预处理图像
img = cv2.resize(img, (28, 28))
img = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
img = img.reshape((1, 28, 28, 1))
# 执行预测
prediction = model.predict(img)

完整代码示例

import cv2

# 加载Haar分类器
face_cascade = cv2.CascadeClassifier('path/to/haar_classifier.xml')

# 加载模型
model = keras.models.load_model('path/to/model.h5')

# 读取图像
img = cv2.imread('path/to/image')

# 转为灰度图
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

# 中值滤波
gray = cv2.medianBlur(gray, 5)

# 对比度增强
gray = cv2.equalizeHist(gray)

# 检测手势
hands = face_cascade.detectMultiScale(gray, 1.3, 5)

for (x, y, w, h) in hands:
    # 绘制矩形框
    cv2.rectangle(img, (x, y), (x + w, y + h), (0, 255, 0), 2)
    # 提取手势图像
    hand_img = img[y:y+h, x:x+w]
    # 预处理手势图像
    hand_img = cv2.resize(hand_img, (28, 28))
    hand_img = cv2.cvtColor(hand_img, cv2.COLOR_BGR2GRAY)
    hand_img = hand_img.reshape((1, 28, 28, 1))
    # 执行预测
    prediction = model.predict(hand_img)
    # 输出预测结果
    print(prediction)

# 显示图像
cv2.imshow('image', img)
cv2.waitKey(0)
cv2.destroyAllWindows()

示例说明

示例1

假设我们有一张包含一只手势的图像,可以使用上述代码进行手势识别。结果会输出一个表示手势字母的数组。

示例2

我们可以使用Webcam进行实时的手势识别。首先需要打开摄像头:

cap = cv2.VideoCapture(0)

然后在循环中获取图像,进行预处理、识别和显示。

while True:
    # 获取图像
    ret, img = cap.read()
    # 预处理
    ...
    # 检测手势
    ...
    # 手势识别
    ...
    # 显示图像
    cv2.imshow('image', img)
    if cv2.waitKey(1) == ord('q'):
        break

# 释放摄像头
cap.release()
cv2.destroyAllWindows()

通过这种方式,可以实时进行手势识别。

相关文章