首页

关于米尔

公司新闻

FacenetPytorch人脸识别方案--基于米尔全志T527开发板

2024-11-28

1881

来源：米尔电子

本篇测评由电子工程世界的优秀测评者“小火苗”提供。

本文将介绍基于米尔电子MYD-LT527开发板（米尔基于全志 T527开发板）的FacenetPytorch人脸识别方案测试。

一、facenet_pytorch算法实现人脸识别

深度神经网络

1.简介

Facenet-PyTorch 是一个基于 PyTorch 框架实现的人脸识别库。它提供了 FaceNet 模型的 PyTorch 实现，可以用于训练自己的人脸识别模型。FaceNet 是由 Google 研究人员提出的一种深度学习模型，专门用于人脸识别任务。

在利用PyTorch神经网络算法进行人脸图像对比的实验设置中，我们专注于对比环节，而不涉及实际项目的完整实现细节。但55555贴近实际应用，我们可以构想以下流程：

1）捕捉新人脸图像：首先，我们使用摄像头或其他图像采集设备捕捉一张新的人脸照片。
2）加载存储的人脸图像：接着，从数据库中加载所有已存储的人脸图像。这些图像是之前采集并存储的，用于与新捕捉到的人脸照片进行对比。
3）构建神经网络模型：为了实现对比功能，我们需要一个预先训练好或自定义的神经网络模型。这个模型能够提取人脸图像中的关键特征，使得相似的图像在特征空间中具有相近的表示。
4）特征提取：利用神经网络模型，对新捕捉到的人脸照片和存储的每一张人脸图像进行特征提取。这些特征向量将用于后续的对比计算。
5）计算相似度：采用合适的相似度度量方法（如余弦相似度、欧氏距离等），计算新照片特征向量与存储图像特征向量之间的相似度。
6）确定匹配图像：根据相似度计算结果，找到与新照片相似度最高的存储图像，即认为这两张图像匹配成功。
7）输出匹配结果：最后，输出匹配成功的图像信息或相关标识，以完成人脸对比的实验任务。

2.核心组件
MTCNN：Multi-task Cascaded Convolutional Networks，即多任务级联卷积网络，专门设计用于同时进行人脸检测和对齐。它在处理速度和准确性上都有出色的表现，是当前人脸检测领域的主流算法之一。
FaceNet：由Google研究人员提出的一种深度学习模型，专门用于人脸识别任务。FaceNet通过将人脸图像映射到一个高维空间，使得同一个人的不同图像在这个空间中的距离尽可能小，而不同人的图像距离尽可能大。这种嵌入表示可以直接用于人脸验证、识别和聚类。

3.功能

支持人脸检测：使用MTCNN算法进行人脸检测，能够准确识别出图像中的人脸位置。

支持人脸识别：使用FaceNet算法进行人脸识别，能够提取人脸特征并进行相似度计算，实现人脸验证和识别功能。

二、安装facenet_pytorch库

1.更新系统

更新ubuntu系统，详情查看米尔提供的资料文件

2.更新系统软件

apt-get update

3.安装git等支持软件

sudo apt-get install -y python3-dev python3-pip libopenblas-dev libssl-dev libffi-dev git cmake

4.安装Pytorch支持工具

# 克隆 PyTorch 源代码
git clone --recursive https://github.com/pytorch/pytorch
# 进入 PyTorch 目录
cd pytorch
# 安装 PyTorch (需要根据你的需求选择 CUDA 版本，如果不需要 GPU 支持则不需要 --cuda 参数)
pip3 install --no-cache-dir torch -f https://download.pytorch.org/whl/torch_stable.html
# 测试 PyTorch 安装
python3 -c "import torch; print(torch.__version__)"

5.安装facenet_pytorch

pip3 install facenet_pytorch

三、CSDN参考案例

1.代码实现

############face_demo.py#############################
import cv2
import torch
from facenet_pytorch import MTCNN, InceptionResnetV1
# 获得人脸特征向量
def load_known_faces(dstImgPath, mtcnn, resnet):
aligned = []
knownImg = cv2.imread(dstImgPath) # 读取图片
face = mtcnn(knownImg) # 使用mtcnn检测人脸，返回人脸数组
if face is not None:
aligned.append(face[0])
aligned = torch.stack(aligned).to(device)
with torch.no_grad():
known_faces_emb = resnet(aligned).detach().cpu()
# 使用ResNet模型获取人脸对应的特征向量
print("n人脸对应的特征向量为：n", known_faces_emb)
return known_faces_emb, knownImg
# 计算人脸特征向量间的欧氏距离，设置阈值，判断是否为同一张人脸
def match_faces(faces_emb, known_faces_emb, threshold):
isExistDst = False
distance = (known_faces_emb[0] - faces_emb[0]).norm().item()
print("n两张人脸的欧式距离为：%.2f" % distance)
if (distance < threshold):
isExistDst = True
return isExistDst
if __name__ == '__main__':
# help(MTCNN)
# help(InceptionResnetV1)
# 获取设备
device = torch.device('cuda:0' if torch.cuda.is_available() else 'cpu')
# mtcnn模型加载设置网络参数，进行人脸检测
mtcnn = MTCNN(min_face_size=12, thresholds=[0.2, 0.2, 0.3],
keep_all=True, device=device)
# InceptionResnetV1模型加载用于获取人脸特征向量
resnet = InceptionResnetV1(pretrained='vggface2').eval().to(device)
MatchThreshold = 0.8 # 人脸特征向量匹配阈值设置
known_faces_emb, _ = load_known_faces('yz.jpg', mtcnn, resnet) # 已知人物图
faces_emb, img = load_known_faces('yz1.jpg', mtcnn, resnet) # 待检测人物图
isExistDst = match_faces(faces_emb, known_faces_emb, MatchThreshold) # 人脸匹配
print("设置的人脸特征向量匹配阈值为：", MatchThreshold)
if isExistDst:
boxes, prob, landmarks = mtcnn.detect(img, landmarks=True)
print('由于欧氏距离小于匹配阈值，故匹配')
else:
print('由于欧氏距离大于匹配阈值，故不匹配')

此代码是使用训练后的模型程序进行使用，在程序中需要标明人脸识别对比的图像。

2.实践过程

第一次运行时系统需要下载预训练的vggface模型，下载过程较长，后面就不需要在下载了运行会很快。如图所示：

3.程序运行异常被终止

运行程序，提示killed，系统杀死了本程序的运行，经过多方面的测试，最终发现是识别的图片过大，使得程序对内存消耗过大导致。后将图片缩小可以正常运行了。

以下是对比图像和对比结果。

四、gitHub开源代码

1.首先下载代码文件
代码库中，大致的介绍了facenet算法的训练步骤等。

2.代码实现
以下是facenet的python代码，注意需要更改下面的一条程序"cuda" False,因为t527使用的是cpu，芯片到时自带gpu但是cuda用不了，因为cuda是英伟达退出的一种计算机架构。

import matplotlib.pyplot as plt
import numpy as np
import torchimport torch.backends.cudnn as cudnn
from nets.facenet import Facenet as facenet
from utils.utils import preprocess_input, resize_image, show_config
#--------------------------------------------#
# 使用自己训练好的模型预测需要修改2个参数
# model_path和backbone需要修改！
#--------------------------------------------#
class Facenet(object):
_defaults = {
#--------------------------------------------------------------------------#
# 使用自己训练好的模型进行预测要修改model_path，指向logs文件夹下的权值文件
# 训练好后logs文件夹下存在多个权值文件，选择验证集损失较低的即可。
# 验证集损失较低不代表准确度较高，仅代表该权值在验证集上泛化性能较好。
#--------------------------------------------------------------------------#
"model_path" : "model_data/facenet_mobilenet.pth",
#--------------------------------------------------------------------------#
# 输入图片的大小。
#--------------------------------------------------------------------------#
"input_shape" : [160, 160, 3],
#--------------------------------------------------------------------------#
# 所使用到的主干特征提取网络
#--------------------------------------------------------------------------#
"backbone" : "mobilenet",
#-------------------------------------------#
# 是否进行不失真的resize
#-------------------------------------------#
"letterbox_image" : True,
#-------------------------------------------#
# 是否使用Cuda# 没有GPU可以设置成False
#-------------------------------------------#
"cuda" : False,
}
@classmethod
def get_defaults(cls, n):
if n in cls._defaults:
return cls._defaults[n]
else:
return "Unrecognized attribute name '" + n + "'"
#---------------------------------------------------#
# 初始化Facenet
#---------------------------------------------------#
def __init__(self, **kwargs):
self.__dict__.update(self._defaults)
for name, value in kwargs.items():
setattr(self, name, value)
self.generate()
show_config(**self._defaults)
def generate(self):
#---------------------------------------------------#
# 载入模型与权值
#---------------------------------------------------#
print('Loading weights into state dict...')
device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
self.net = facenet(backbone=self.backbone, mode="predict").eval()
self.net.load_state_dict(torch.load(self.model_path, map_location=device), strict=False)
print('{} model loaded.'.format(self.model_path))
if self.cuda:
self.net = torch.nn.DataParallel(self.net)
cudnn.benchmark = True
self.net = self.net.cuda()
#---------------------------------------------------#
# 检测图片
#---------------------------------------------------#
def detect_image(self, image_1, image_2):
#---------------------------------------------------#
# 图片预处理，归一化
#---------------------------------------------------#
with torch.no_grad():
image_1 = resize_image(image_1, [self.input_shape[1], self.input_shape[0]], letterbox_image=self.letterbox_image)
image_2 = resize_image(image_2, [self.input_shape[1], self.input_shape[0]], letterbox_image=self.letterbox_image)
photo_1 = torch.from_numpy(np.expand_dims(np.transpose(preprocess_input(np.array(image_1, np.float32)), (2, 0, 1)), 0))
photo_2 = torch.from_numpy(np.expand_dims(np.transpose(preprocess_input(np.array(image_2, np.float32)), (2, 0, 1)), 0))
if self.cuda:
photo_1 = photo_1.cuda()
photo_2 = photo_2.cuda()
#---------------------------------------------------#
# 图片传入网络进行预测
#---------------------------------------------------#
output1 = self.net(photo_1).cpu().numpy()
output2 = self.net(photo_2).cpu().numpy()
#---------------------------------------------------#
# 计算二者之间的距离
#---------------------------------------------------#
l1 = np.linalg.norm(output1 - output2, axis=1)
plt.subplot(1, 2, 1)
plt.imshow(np.array(image_1))
plt.subplot(1, 2, 2)
plt.imshow(np.array(image_2))
plt.text(-12, -12, 'Distance:%.3f' % l1, ha='center', va= 'bottom',fontsize=11)
plt.show()
return l1

3.代码实现
此代码调用的签名的代码，但其可以直接的去调用图片进行人脸识别。

from PIL import Image
from facenet import Facenet
if __name__ == "__main__":
model = Facenet()
while True:
image_1 = input('Input image_1 filename:')
try:
image_1 = Image.open(image_1)
except:
print('Image_1 Open Error! Try again!')
continue
image_2 = input('Input image_2 filename:')
try:
image_2 = Image.open(image_2)
except:
print('Image_2 Open Error! Try again!')
continue
probability = model.detect_image(image_1,image_2)
print(probability)

4.程序运行

运行程序后首先显示的是程序的配置信息，然后可以输入图像对比检测的内容。以下是图像识别的效果和对比的准确率。

五、参考文献

CSDN博客

https://blog.csdn.net/weixin_45939929/article/details/124789487?utm_medium=distribute.pc_relevant.none-task-blog-2~default~baidujs_baidulandingword~default-1-124789487-blog-142987324.235^v43^pc_blog_bottom_relevance_base6&spm=1001.2101.3001.4242.2&utm_relevant_index=4

官方源码来源

https://gitcode.com/gh_mirrors/fac/facenet-pytorch/overview

*部分图片来源于网络，如有版权问题请联系删除

了解更多

更多资讯

2025-10-30

米尔RK3576边缘计算盒精准驱动菜品识别模型性能强悍

❝在人工智能与边缘计算深度融合的今天，将AI模型高效部署于终端设备已成为产业智能化的关键。本文将分享基于米尔MYD-LR3576边缘计算盒子部署菜品识别安卓Demo的实战经验。该设备凭借其内置的强劲瑞芯微RK3576芯片，为视觉识别模型提供了充沛的本地AI算力，成功将“智慧识菜”的能力浓缩于方寸之间，充分证明了其作为边缘AI应用坚实载体的卓越性能与可靠性。❝本文以米尔电子的MYD-LR3576边缘

2025-10-30

米尔与安路联合亮相VisionChina 2025，共推FPGA视觉方案

2025年10月28日，由机器视觉产业联盟主办的“2025深圳机器视觉展暨机器视觉技术及工业应用研讨会（Vision China）”在深圳国际会展中心（宝安）9号馆隆重启幕。展会以“VISION+AI赋能电子制造升级”为主题，聚焦人工智能与机器视觉技术在电子制造全产业链中的融合与创新，集中展示AI技术在提升视觉系统能力、突破行业应用瓶颈方面的前沿成果与解决方案。米尔电子应安路科技的邀请出席此次盛会

2025-10-23

经典再进化：米尔ZYNQ 7010/7020全面适配2024.2工具链

在工业物联网、机器视觉和智能网关等严苛领域，米尔电子的MYC-C7Z010/20-V2与MYC-Y7Z010/20-V2核心板及开发平台，凭借其硬核特性，已成为众多企业信赖的首选方案。我们深知，卓越的硬件平台需要匹配敏捷、高效且安全的软件工具链。为应对开发者对先进工具与日俱增的需求，并前瞻性地响应全球日益严格的网络安全法规，我们对经典的ZYNQ 7010/7020产品进行一次里程碑式的软件生态升级

2025-10-16

从微秒级响应到确定性延迟：深入解析米尔全志T536核心板的实时性技术突破

各位工程师同仁，今天咱们聊点硬核的——实时性。这不是那种"差不多就行"的性能指标，在工业控制、机器人运动、电力保护这些领域，实时性就是生命线。想象一下：工业机器人抓取精密元件时，哪怕几毫秒的延迟都可能导致良品率暴跌；电力系统故障检测，响应慢了几个毫秒可能就是一场灾难。为什么通用Linux在实时场景中"力不从心"？标准Linux内核设计初衷是"公平调

2025-10-16

米尔电子获全志科技生态认证，共推工业智能化升级

在近日举办的2025中国国际工业博览会上，米尔电子被全志科技正式授予“生态认证合作伙伴”证书，标志着双方在嵌入式处理器模组领域的合作迈入新阶段。此次认证基于米尔电子在T536、T527、T113等全志工业级核心板及开发板被市场的高度认可，米尔电子的全志系列产品已广泛应用于工业自动化、机器人及边缘计算场景。米尔代表领取“生态认证合作伙伴”证书（右三）‌生态共建：全产业链协同创新‌全志科技通过“芯片+

2025-10-16

名单揭晓，追加30套开发板！米尔-安路飞龙派「硬核创造力」第二季

经过米尔电子和安路科技的严格筛选，30位「硬核玩家」从千帆竞逐中脱颖而出，正式成为米尔-安路飞龙派第二季创意秀的玩家。开发者们将以MYD-YM90X开发板为起点，开启一场FPGA的盛宴，在安路飞龙派的赛道上探索无限可能！现将入选的30位开发者/团队名单公布如下（排名不分先后）：

2025-09-26

颂歌迎国庆丨米尔电子国庆节及中秋放假通知及温馨提示

金风送爽，秋桂飘香，阖家欢聚，共庆国昌。我们即将迎来中秋佳节及祖国76周年华诞。在这美好的金秋时节，在这家国同庆之际，米尔全体员工衷心感谢您长期以来的信任和支持，预祝您节日快乐！·国庆放假时间·一二三四五六日29初八30初九1国庆2十一3十二4十三5十四6中秋7十六8十七9十八10十九11二十12廿一10月1日至 10月8日，共放假8天根据《国务院办公厅关于2025年部分节假日安排的通知》相关内

2025-09-26

如何移植EtherCAT Igh--基于米尔RK3576开发板

本文将介绍基于米尔电子MYD-LR3576开发板（米尔基于瑞芯微 RK3576开发板）的板端移植EtherCAT Igh方案的开发测试。摘自优秀创作者-EPTmachine米尔基于瑞芯微RK3576开发板EtherCAT IgH需要保证高实时性，Preempt-RT是一种针对实时性能进行了优化的Linux内核。与普通的Linux内核相比，Preempt-RT具有以下优势：实时性能： Preempt

2025-09-18

追加！30套FPGA开发板免费送！米尔-安路飞龙派创意秀活动再开启

大赛简介日前，米尔电子2025年举办的米尔-安路飞龙派FPGA/FPSoC创意开发大赛圆满落幕，吸引了众多工程师踊跃参与。为持续推动技术创新，米尔电子现重磅推出第二期福利活动——基于安路DR1M90开发板的创意秀，再次免费赠送30套FPGA开发板，旨在鼓励工程师突破思维边界，通过实践探索安路飞龙派产品的无限可能，为创新应用提供强力支持。报名条件：用户需关注米尔电子公众号；第一期已领开发板的用户不可

2025-09-11

“一芯四用”，米尔RK3576如何同时驾驭4路YOLOv8视频流？

在科技飞速发展的当下，人工智能与边缘计算的融合正以前所未有的速度重塑着我们的生活。RK3576芯片拥有4核Cortex-A72以及4核Cortex-A53提供基础算力，6TOPS算力NPU来模型推导运算。使用YOLOv8模型时也是手到擒来，接下来随着步伐看看它表现如何。YOLO简介YOLO（You Only Look Once）是当前业界领先的实时目标检测算法系列，以其速度和精度的完美平衡而闻名。

米尔动态

FacenetPytorch人脸识别方案--基于米尔全志T527开发板

全志T527处理器