首页

关于米尔

公司新闻

人脸疲劳检测应用-米尔基于RK3576核心板/开发板

2024-12-18

1441

来源：米尔电子

本篇源自：优秀创作者 lulugl

本文将介绍基于米尔电子MYD-LR3576开发板（米尔基于瑞芯微 RK3576开发板）的人脸疲劳检测方案测试。

米尔基于RK3576核心板/开发板

【前言】

人脸疲劳检测：一种通过分析人脸特征来判断一个人是否处于疲劳状态的技术。其原理主要基于计算机视觉和机器学习方法。当人疲劳时，面部会出现一些特征变化，如眼睛闭合程度增加、眨眼频率变慢、打哈欠、头部姿态改变等。
例如，通过检测眼睛的状态来判断疲劳程度是一个关键部分。正常情况下，人的眨眼频率相对稳定，而当疲劳时，眨眼频率会降低，并且每次眨眼时眼睛闭合的时间可能会延长。同时，头部可能会不自觉地下垂或者摇晃，这些特征都可以作为疲劳检测的依据。米尔MYC-LR3576采用8核CPU+搭载6 TOPS的NPU加速器，3D GPU，能够非常轻松的实现这个功能，下面就如何实现这一功能分享如下：

【硬件】

1、米尔MYC-LR3576开发板
2、USB摄像头

【软件】

1、v4l2
2、openCV
3、dlib库：dlib 是一个现代化的 C++ 工具包，它包含了许多用于机器学习、图像处理、数值计算等多种任务的算法和工具。它的设计目标是提供高性能、易于使用的库，并且在开源社区中被广泛应用。

【实现步骤】

1、安装python-opencv
2、安装dlib库
3、安装v4l2库

【代码实现】

1、引入cv2、dlib以及线程等：

import cv2
import dlib
import numpy as np
import time
from concurrent.futures import ThreadPoolExecutor
import threading

2、初始化dlib的面部检测器和特征点预测器

detector = dlib.get_frontal_face_detector()
predictor = dlib.shape_predictor('shape_predictor_68_face_landmarks.dat')

3、定义计算眼睛纵横比的函数

def eye_aspect_ratio(eye):
    A = np.linalg.norm(np.array(eye[1]) - np.array(eye[5]))
    B = np.linalg.norm(np.array(eye[2]) - np.array(eye[4]))
    C = np.linalg.norm(np.array(eye[0]) - np.array(eye[3]))
    ear = (A + B) / (2.0 * C)                                                                                
    return ear

4、定义计算头部姿势的函数

def get_head_pose(shape):
    # 定义面部特征点的三维坐标
    object_points = np.array([
        (0.0, 0.0, 0.0),             # 鼻尖
        (0.0, -330.0, -65.0),        # 下巴
        (-225.0, 170.0, -135.0),     # 左眼左眼角
        (225.0, 170.0, -135.0),      # 右眼右眼角
        (-150.0, -150.0, -125.0),    # 左嘴角
        (150.0, -150.0, -125.0)      # 右嘴角
    ], dtype=np.float32)

    image_pts = np.float32([shape[i] for i in [30, 8, 36, 45, 48, 54]])
    size = frame.shape
    focal_length = size[1]
    center = (size[1] // 2, size[0] // 2)
    camera_matrix = np.array(
        [[focal_length, 0, center[0]],
         [0, focal_length, center[1]],
         [0, 0, 1]], dtype="double"
    )

    dist_coeffs = np.zeros((4, 1))
    (success, rotation_vector, translation_vector) = cv2.solvePnP(
        object_points, image_pts, camera_matrix, dist_coeffs, flags=cv2.SOLVEPNP_ITERATIVE
    )

    rmat, _ = cv2.Rodrigues(rotation_vector)
    angles, _, _, _, _, _ = cv2.RQDecomp3x3(rmat)
    return angles

5、定义眼睛纵横比阈值和连续帧数阈值

EYE_AR_THRESH = 0.3
EYE_AR_CONSEC_FRAMES = 48

6、打开摄像头
我们先使用v4l2-ctl --list-devices来例出接在开发板上的列表信息：

USB Camera: USB Camera (usb-xhci-hcd.0.auto-1.2):
        /dev/video60
        /dev/video61
        /dev/media7

在代码中填入60为摄像头的编号：

cap = cv2.VideoCapture(60)
cap.set(cv2.CAP_PROP_FRAME_WIDTH, 480)  # 降低分辨率
cap.set(cv2.CAP_PROP_FRAME_HEIGHT, 320)

7、创建多线程处理函数，实现采集与分析分离：

# 多线程处理函数
def process_frame(frame):
    global COUNTER, TOTAL
    gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)
    faces = detector(gray, 0)  # 第二个参数为0，表示不使用upsampling

    for face in faces:
        landmarks = predictor(gray, face)
        shape = [(landmarks.part(i).x, landmarks.part(i).y) for i in range(68)]
        
        left_eye = shape[36:42]
        right_eye = shape[42:48]

        left_ear = eye_aspect_ratio(left_eye)
        right_ear = eye_aspect_ratio(right_eye)
        ear = (left_ear + right_ear) / 2.0

        if ear < EYE_AR_THRESH:
            with lock:
                COUNTER += 1
        else:
            with lock:
                if COUNTER >= EYE_AR_CONSEC_FRAMES:
                    TOTAL += 1
                COUNTER = 0

        # 绘制68个特征点
        for n in range(0, 68):
            x, y = shape[n]
            cv2.circle(frame, (x, y), 2, (0, 255, 0), -1)

        cv2.putText(frame, f"Eye AR: {ear:.2f}", (10, 30), cv2.FONT_HERSHEY_SIMPLEX, font_scale, (0, 0, 255), 2)
        cv2.putText(frame, f"Blink Count: {TOTAL}", (10, 60), cv2.FONT_HERSHEY_SIMPLEX, font_scale, (0, 0, 255), 2)

        # 计算头部姿势
        angles = get_head_pose(shape)
        pitch, yaw, roll = angles
        cv2.putText(frame, f"Pitch: {pitch:.2f}", (10, 120), cv2.FONT_HERSHEY_SIMPLEX, font_scale, (0, 0, 255), 2)
        cv2.putText(frame, f"Yaw: {yaw:.2f}", (10, 150), cv2.FONT_HERSHEY_SIMPLEX, font_scale, (0, 0, 255), 2)
        cv2.putText(frame, f"Roll: {roll:.2f}", (10, 180), cv2.FONT_HERSHEY_SIMPLEX, font_scale, (0, 0, 255), 2)

        # 判断疲劳状态
        if COUNTER >= EYE_AR_CONSEC_FRAMES or abs(pitch) > 30 or abs(yaw) > 30 or abs(roll) > 30:
            cv2.putText(frame, "Fatigue Detected!", (10, 210), cv2.FONT_HERSHEY_SIMPLEX, font_scale, (0, 0, 255), 2)

    return frame

8、创建图像显示线程：

with ThreadPoolExecutor(max_workers=2) as executor:
    future_to_frame = {}
    while True:
        ret, frame = cap.read()
        if not ret:
            break

        # 提交当前帧到线程池
        future = executor.submit(process_frame, frame.copy())
        future_to_frame[future] = frame

        # 获取已完成的任务结果
        for future in list(future_to_frame.keys()):
            if future.done():
                processed_frame = future.result()
                cv2.imshow("Frame", processed_frame)
                del future_to_frame[future]
                break

        # 计算帧数
        fps_counter += 1
        elapsed_time = time.time() - start_time
        if elapsed_time > 1.0:
            fps = fps_counter / elapsed_time
            fps_counter = 0
            start_time = time.time()
            cv2.putText(processed_frame, f"FPS: {fps:.2f}", (10, 90), cv2.FONT_HERSHEY_SIMPLEX, 0.7, (0, 0, 255), 2)

        if cv2.waitKey(1) & 0xFF == ord('q'):

实现效果：

根据检测的结果，我们就可以来实现疲劳提醒等等的功能。
整体代码如下：

import cv2
import dlib
import numpy as np
import time
from concurrent.futures import ThreadPoolExecutor
import threading

# 初始化dlib的面部检测器和特征点预测器
detector = dlib.get_frontal_face_detector()
predictor = dlib.shape_predictor('shape_predictor_68_face_landmarks.dat')

# 修改字体大小
font_scale = 0.5  # 原来的字体大小是0.7，现在改为0.5

# 定义计算眼睛纵横比的函数
def eye_aspect_ratio(eye):
    A = np.linalg.norm(np.array(eye[1]) - np.array(eye[5]))
    B = np.linalg.norm(np.array(eye[2]) - np.array(eye[4]))
    C = np.linalg.norm(np.array(eye[0]) - np.array(eye[3]))
    ear = (A + B) / (2.0 * C)                                                                                
    return ear

# 定义计算头部姿势的函数
def get_head_pose(shape):
    # 定义面部特征点的三维坐标
    object_points = np.array([
        (0.0, 0.0, 0.0),             # 鼻尖
        (0.0, -330.0, -65.0),        # 下巴
        (-225.0, 170.0, -135.0),     # 左眼左眼角
        (225.0, 170.0, -135.0),      # 右眼右眼角
        (-150.0, -150.0, -125.0),    # 左嘴角
        (150.0, -150.0, -125.0)      # 右嘴角
    ], dtype=np.float32)

    image_pts = np.float32([shape[i] for i in [30, 8, 36, 45, 48, 54]])
    size = frame.shape
    focal_length = size[1]
    center = (size[1] // 2, size[0] // 2)
    camera_matrix = np.array(
        [[focal_length, 0, center[0]],
         [0, focal_length, center[1]],
         [0, 0, 1]], dtype="double"
    )

    dist_coeffs = np.zeros((4, 1))
    (success, rotation_vector, translation_vector) = cv2.solvePnP(
        object_points, image_pts, camera_matrix, dist_coeffs, flags=cv2.SOLVEPNP_ITERATIVE
    )

    rmat, _ = cv2.Rodrigues(rotation_vector)
    angles, _, _, _, _, _ = cv2.RQDecomp3x3(rmat)
    return angles

# 定义眼睛纵横比阈值和连续帧数阈值
EYE_AR_THRESH = 0.3
EYE_AR_CONSEC_FRAMES = 48

# 初始化计数器
COUNTER = 0
TOTAL = 0

# 创建锁对象
lock = threading.Lock()

# 打开摄像头
cap = cv2.VideoCapture(60)
cap.set(cv2.CAP_PROP_FRAME_WIDTH, 480)  # 降低分辨率
cap.set(cv2.CAP_PROP_FRAME_HEIGHT, 320)

# 初始化帧计数器和时间戳
fps_counter = 0
start_time = time.time()

# 多线程处理函数
def process_frame(frame):
    global COUNTER, TOTAL
    gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)
    faces = detector(gray, 0)  # 第二个参数为0，表示不使用upsampling

    for face in faces:
        landmarks = predictor(gray, face)
        shape = [(landmarks.part(i).x, landmarks.part(i).y) for i in range(68)]
        
        left_eye = shape[36:42]
        right_eye = shape[42:48]

        left_ear = eye_aspect_ratio(left_eye)
        right_ear = eye_aspect_ratio(right_eye)
        ear = (left_ear + right_ear) / 2.0

        if ear < EYE_AR_THRESH:
            with lock:
                COUNTER += 1
        else:
            with lock:
                if COUNTER >= EYE_AR_CONSEC_FRAMES:
                    TOTAL += 1
                COUNTER = 0

        # 绘制68个特征点
        for n in range(0, 68):
            x, y = shape[n]
            cv2.circle(frame, (x, y), 2, (0, 255, 0), -1)

        cv2.putText(frame, f"Eye AR: {ear:.2f}", (10, 30), cv2.FONT_HERSHEY_SIMPLEX, font_scale, (0, 0, 255), 2)
        cv2.putText(frame, f"Blink Count: {TOTAL}", (10, 60), cv2.FONT_HERSHEY_SIMPLEX, font_scale, (0, 0, 255), 2)

        # 计算头部姿势
        angles = get_head_pose(shape)
        pitch, yaw, roll = angles
        cv2.putText(frame, f"Pitch: {pitch:.2f}", (10, 120), cv2.FONT_HERSHEY_SIMPLEX, font_scale, (0, 0, 255), 2)
        cv2.putText(frame, f"Yaw: {yaw:.2f}", (10, 150), cv2.FONT_HERSHEY_SIMPLEX, font_scale, (0, 0, 255), 2)
        cv2.putText(frame, f"Roll: {roll:.2f}", (10, 180), cv2.FONT_HERSHEY_SIMPLEX, font_scale, (0, 0, 255), 2)

        # 判断疲劳状态
        if COUNTER >= EYE_AR_CONSEC_FRAMES or abs(pitch) > 30 or abs(yaw) > 30 or abs(roll) > 30:
            cv2.putText(frame, "Fatigue Detected!", (10, 210), cv2.FONT_HERSHEY_SIMPLEX, font_scale, (0, 0, 255), 2)

    return frame

with ThreadPoolExecutor(max_workers=2) as executor:
    future_to_frame = {}
    while True:
        ret, frame = cap.read()
        if not ret:
            break

        # 提交当前帧到线程池
        future = executor.submit(process_frame, frame.copy())
        future_to_frame[future] = frame

        # 获取已完成的任务结果
        for future in list(future_to_frame.keys()):
            if future.done():
                processed_frame = future.result()
                cv2.imshow("Frame", processed_frame)
                del future_to_frame[future]
                break

        # 计算帧数
        fps_counter += 1
        elapsed_time = time.time() - start_time
        if elapsed_time > 1.0:
            fps = fps_counter / elapsed_time
            fps_counter = 0
            start_time = time.time()
            cv2.putText(processed_frame, f"FPS: {fps:.2f}", (10, 90), cv2.FONT_HERSHEY_SIMPLEX, 0.7, (0, 0, 255), 2)

        if cv2.waitKey(1) & 0xFF == ord('q'):
            break

# 释放摄像头并关闭所有窗口
cap.release()
cv2.destroyAllWindows()

【总结】

【米尔MYC-LR3576核心板及开发板】
这块开发板性能强大，能轻松实现对人脸的疲劳检测，通过计算结果后进入非常多的工业、人工智能等等的实用功能。

米尔RK3576开发板折扣活动火热进行中，购买链接：

https://detail.tmall.com/item.htm?id=846172160887

了解更多

更多资讯

2025-09-11

“一芯四用”，米尔RK3576如何同时驾驭4路YOLOv8视频流？

在科技飞速发展的当下，人工智能与边缘计算的融合正以前所未有的速度重塑着我们的生活。RK3576芯片拥有4核Cortex-A72以及4核Cortex-A53提供基础算力，6TOPS算力NPU来模型推导运算。使用YOLOv8模型时也是手到擒来，接下来随着步伐看看它表现如何。YOLO简介YOLO（You Only Look Once）是当前业界领先的实时目标检测算法系列，以其速度和精度的完美平衡而闻名。

2025-09-04

6TOPS算力驱动30亿参数LLM，米尔RK3576部署端侧多模态多轮对话

关键词：瑞芯微 RK3576、NPU（神经网络处理器）、端侧小语言模型（SLM）、多模态 LLM、边缘 AI 部署、开发板当 GPT-4o 用毫秒级响应处理图文混合指令、Gemini-1.5-Pro 以百万 token 上下文 “消化” 长文档时，行业的目光正从云端算力竞赛转向一个更实际的命题：如何让智能 “落地”？—— 摆脱网络依赖、保护本地隐私、控制硬件成本，让设备真正具备 “看见并对话” 的

2025-09-04

直播预告 | 恩智浦技术日巡回研讨会：技术盛宴，“云端”开席！

9月9日，恩智浦技术日巡回研讨会将在杭州举办！活动同期，恩智浦携手生态合作伙伴，将对会议中精彩的技术演讲全程进行网络直播，让更多的开发者足不出户，也能够直击活动现场，解锁前沿产品方案，共赴“云端”技术盛宴！直播期间，参与观众互动，还有好礼等你拿~~点击文章顶部卡片，或扫描海报二维码，约起来吧！

2025-08-28

米尔发表演讲，并携瑞萨RZ产品亮相2025 Elexcon深圳电子展

2025年8月26日-28日，‌Elexcon深圳国际电子展‌在‌深圳会展中心（福田）1号馆‌（展台号：1L30）盛大举行。作为全球电子产业链的重要盛会，展会汇聚创新技术与行业解决方案。米尔电子MYIR携RZ系列核心板、开发板等方案Demo亮相瑞萨嵌入式MCU/MPU生态专区，并发表主题演讲。技术盛宴：瑞萨RZ系列产品矩阵亮相展会上，米尔展示了基于RZ/G2L、RZ/G2UL、RZ/T2H的核心板

2025-08-28

留言领奖！2025 STM32研讨会即将启幕，米尔期待与你共会

2025年9月11日及9月17日，STM32研讨会将走进北京和上海，为大家深入解读STM32的中国战略，并围绕STM32在不同领域的最新产品布局和生态展开主题演讲，包括边缘人工智能、电源能源、无线连接、安全等，深入探讨STM32带来的前沿科技成果。同时，STM32还将携手业内多家合作伙伴，展示STM32在更多领域的解决方案及应用实例。欢迎开发者及工程师莅临现场，与ST专家面对面沟通交流，体验不同产

2025-08-28

Qwen2-VL-3B模型在米尔瑞芯微RK3576开发板NPU多模态部署指导与评测

关键词：瑞芯微 RK3576、NPU（神经网络处理器）、端侧小语言模型（SLM）、多模态 LLM、边缘 AI 部署、开发板、RKLLM随着大语言模型（LLM）技术的快速迭代，从云端集中式部署到端侧分布式运行的趋势日益明显。端侧小型语言模型（SLM）凭借低延迟、高隐私性和离线可用的独特优势，正在智能设备、边缘计算等场景中展现出巨大潜力。瑞芯微 RK3576 开发板作为一款聚焦边缘 AI 的硬件平台，

2025-08-14

12路1080P高清视频流，米尔RK3576开发板重塑视频处理极限

在智能视觉技术不断发展的今天，多路摄像数据的处理与传输已成为众多应用场景的核心需求。从智能安防监控领域的全面覆盖，到工业视觉处理网关的精准检测，再到车载环视融合平台的实时驾驶辅助以及智慧社区AI防控的快速响应，多路摄像数据的处理与传输已成为关键需求，而高效且低延时的解决方案则是实现这些应用的核心。目前多路摄像传输方案往往存在一定局限，接入路数有限，难以满足大规模监控场景的需求，且延迟较高，影响实时

2025-08-14

共建生态，米尔将出席2025安路科技FPGA技术沙龙

在数字化浪潮席卷全球的今天，FPGA技术正成为驱动创新的核心引擎。2025年8月21日，深圳将迎来一场聚焦FPGA技术与产业应用的盛会——2025安路科技FPGA技术沙龙。本次沙龙以“定制未来共建生态”为主题，汇聚行业专家、企业代表及技术开发者，探讨前沿技术趋势，解锁定制化解决方案，共建开放共赢的FPGA生态圈!米尔作为领先的嵌入式处理器模组厂商，将携安路FPGA核心板和开发板亮相，并发表主题演

2025-08-08

如何在RK3576开发板上板端编译OpenCV并搭建应用

本文将介绍基于米尔电子MYD-LR3576开发板（米尔基于瑞芯微 RK3576开发板）的板端编译OpenCV及环境搭建方案的开发测试。摘自优秀创作者-短笛君RK3576具有如下配置：4× Cortex-A72（大核，主频最高 2.2GHz）4× Cortex-A53（小核，主频最高 1.8GHz）NPU（AI加速单元）：独立 NPU，算力典型值6 TOPS（INT8）支持 TensorFlow L

2025-08-08

倒计时！米尔-安路飞龙派创意秀奖品等您领~~

创意秀活动进入倒计时阶段‌2025年米尔-安路飞龙派FPGA FPSoC创意开发大赛即将于8月15日正式收官（原定于6月15日，已延期到8月15日）。作为国产工业级FPGA领域的赛事，本次活动已吸引多支开发团队参与，基于MYD-YM90X开发板产出了众多创新解决方案。现距截稿仅剩7天，米尔特别提醒尚未提交作品的开发者把握最后几天，分享您的技术创作，申领米尔电子的奖品。活动链接：https://mp

米尔动态

人脸疲劳检测应用-米尔基于RK3576核心板/开发板

RK3576处理器