C++使用OpenCV进行物体识别与检测的三种方法-牛翰网

1. OpenCV 环境配置回顾

在进行物体识别与检测之前，需要先确保安装并配置好 OpenCV 库。如果你还没有配置 OpenCV，可以参考以下步骤：

安装 OpenCV：你可以通过官网下载安装包，或者使用 vcpkg 或 conan 等包管理工具来安装 OpenCV。
配置 IDE：确保 IDE（如 Visual Studio 或 CLion）正确设置了 OpenCV 的路径，包含头文件路径和库文件路径。

2. Haar 特征分类器

Haar 特征分类器是一种基于机器学习的物体检测方法，最早用于人脸检测。OpenCV 提供了预训练的 Haar 分类器模型，可以快速进行人脸、眼睛、行人等物体的检测。

人脸检测

OpenCV 提供了多个预训练的分类器，如 haarcascade_frontalface_default.xml 用于人脸检测。我们可以直接加载这个分类器进行人脸检测。

#include <opencv2/opencv.hpp>
using namespace cv;
 
int main() {
    // 读取输入图像
    Mat image = imread("people.jpg");
 
    if (image.empty()) {
        std::cout << "Error loading image!" << std::endl;
        return -1;
    }
 
    // 将图像转换为灰度图
    Mat grayImage;
    cvtColor(image, grayImage, COLOR_BGR2GRAY);
 
    // 加载预训练的人脸分类器
    CascadeClassifier faceCascade;
    if (!faceCascade.load("haarcascade_frontalface_default.xml")) {
        std::cout << "Error loading cascade file!" << std::endl;
        return -1;
    }
 
    // 检测人脸
    std::vector<Rect> faces;
    faceCascade.detectMultiScale(grayImage, faces);
 
    // 绘制矩形框标记人脸
    for (size_t i = 0; i < faces.size(); i++) {
        rectangle(image, faces[i], Scalar(0, 255, 0), 2);
    }
 
    // 显示检测结果
    imshow("Detected Faces", image);
    waitKey(0);
 
    return 0;
}

CascadeClassifier::load() 方法用于加载预训练的 Haar 分类器文件。
detectMultiScale() 方法用于检测图像中的人脸，返回值是一个 Rect 向量，包含检测到的人脸矩形区域。
rectangle() 方法用来在图像上绘制矩形框。

其他分类器

OpenCV 提供了多种 Haar 分类器，用于检测眼睛、上半身、下半身等物体。例如：

CascadeClassifier eyeCascade;
eyeCascade.load("haarcascade_eye.xml");
eyeCascade.detectMultiScale(grayImage, eyes);

3. HOG 特征与行人检测

HOG（Histogram of Oriented Gradients）特征是另一种常用于物体检测的技术，特别适用于行人检测。OpenCV 中提供了一个 HOGDescriptor 类，用于提取 HOG 特征，并结合支持向量机（SVM）进行行人检测。

行人检测

#include <opencv2/opencv.hpp>
#include <opencv2/objdetect.hpp>
using namespace cv;
 
int main() {
    // 读取输入图像
    Mat image = imread("people.jpg");
 
    if (image.empty()) {
        std::cout << "Error loading image!" << std::endl;
        return -1;
    }
 
    // 创建 HOG 描述符
    HOGDescriptor hog;
    hog.setSVMDetector(HOGDescriptor::getDefaultPeopleDetector());
 
    // 检测图像中的行人
    std::vector<Rect> foundLocations;
    hog.detectMultiScale(image, foundLocations);
 
    // 在图像中绘制检测到的行人位置
    for (size_t i = 0; i < foundLocations.size(); i++) {
        rectangle(image, foundLocations[i], Scalar(0, 255, 0), 2);
    }
 
    // 显示检测结果
    imshow("Detected People", image);
    waitKey(0);
 
    return 0;
}

HOGDescriptor 是用于提取 HOG 特征的 OpenCV 类，detectMultiScale() 方法用来进行行人检测。
getDefaultPeopleDetector() 是一个预训练的行人检测器。

4. 基于深度学习的物体检测

除了传统的机器学习方法，基于深度学习的物体检测已经成为主流。OpenCV 支持通过深度学习框架（如 Caffe、TensorFlow、ONNX）加载并使用预训练的深度学习模型进行物体检测。

使用预训练模型进行物体检测

以 YOLO（You Only Look Once）为例，YOLO 是一个非常流行的实时物体检测模型，它能够同时检测图像中的多个物体并返回类别与位置。OpenCV 支持加载和使用 YOLO 模型进行物体检测。

下载 YOLO 模型：
- 下载 YOLOv3 权重文件（yolov3.weights）和配置文件（yolov3.cfg）。
- 下载 COCO 类别文件（coco.names）。
使用 YOLO 模型进行物体检测：

#include <opencv2/opencv.hpp>
#include <opencv2/dnn.hpp>
using namespace cv;
using namespace cv::dnn;
 
int main() {
    // 加载 YOLO 模型
    Net net = readNet("yolov3.weights", "yolov3.cfg");
    std::vector<String> outNames = net.getUnconnectedOutLayersNames();
 
    // 加载类别名称
    std::ifstream ifs("coco.names");
    std::vector<std::string> classes;
    std::string line;
    while (getline(ifs, line)) {
        classes.push_back(line);
    }
 
    // 读取输入图像
    Mat image = imread("image.jpg");
 
    // 转换图像为 YOLO 输入格式
    Mat blob = blobFromImage(image, 1 / 255.0, Size(416, 416), Scalar(), true, false);
 
    // 设置网络输入
    net.setInput(blob);
 
    // 获取 YOLO 输出
    std::vector<Mat> outs;
    net.forward(outs, outNames);
 
    // 处理输出
    for (size_t i = 0; i < outs.size(); i++) {
        Mat detectionMat = outs[i];
        for (int j = 0; j < detectionMat.rows; j++) {
            // 提取检测框信息（置信度、类标签、边界框）
            float confidence = detectionMat.at<float>(j, 4);
            if (confidence > 0.5) {  // 只显示置信度大于 0.5 的检测结果
                int classId = -1;
                float maxClassConf = -1;
                for (int k = 5; k < detectionMat.cols; k++) {
                    if (detectionMat.at<float>(j, k) > maxClassConf) {
                        maxClassConf = detectionMat.at<float>(j, k);
                        classId = k - 5;
                    }
                }
 
                // 计算边界框
                int x = int(detectionMat.at<float>(j, 0) * image.cols);
                int y = int(detectionMat.at<float>(j, 1) * image.rows);
                int width = int(detectionMat.at<float>(j, 2) * image.cols);
                int height = int(detectionMat.at<float>(j, 3) * image.rows);
 
                // 绘制边界框
                rectangle(image, Rect(x, y, width, height), Scalar(0, 255, 0), 2);
                putText(image, classes[classId], Point(x, y - 5), FONT_HERSHEY_SIMPLEX, 1, Scalar(0, 255, 0), 2);
            }
        }
    }
 
    // 显示检测结果
    imshow("YOLO Object Detection", image);
    waitKey(0);
 
    return 0;
}