建筑兔零基础自学python记录22|实战人脸识别项目——视频人脸识别(下)11

这次我们继续解读代码,我们主要来看下面两个部分;

至于人脸识别成功的要点我们在最后总结~

具体代码学习:

#定义人脸名称
def name():#预学习照片存放位置path = 'M:/python/workspace/PythonProject/face/'imagePaths=[os.path.join(path,f) for f in os.listdir(path)]for imagePath in imagePaths:name = str(os.path.split(imagePath)[1].split('.',2)[1])names.append(name)

(1)os.path.join()协调文件路径中'/'   '\'差异

     将多个路径组件智能地拼接成一个完整的路径。由于不同操作系统的差异,os.path.join() 可以根据当前操作系统自动处理这些差异。

补充:不同操作系统使用不同的路径分隔符。

           Windows 使用反斜杠 \,Unix/Linux 和 macOS 使用正斜杠 /

#举例:
import os# 拼接路径
path = os.path.join('home', 'user', 'documents')
print(path)
  • 在 Windows 系统上,输出可能是 home\user\documents
  • 在 Unix/Linux 或 macOS 系统上,输出为 home/user/documents

(2)os.listdir()输出某目录下所有文件名

即os.listdir(path)获得了['1.lss.jpg', '2.lss.jpg']

os.path.join()将路径M:\python\workspace\PythonProject\face替换为

M:/python/workspace/PythonProject/face/1.lss.jpg

M:/python/workspace/PythonProject/face/2.lss.jpg

  • os.path.join(path, f)这里path 是前面指定的目录路径,fos.listdir(path) 返回列表中的每个元素(即文件或文件夹名称)。
  • 代码比较长,我们来看一下这个循环的内容:

      这行代码遍历 os.listdir(path) 返回的列表,对每个文件名 调用 os.path.join(path, f) 进行路径拼接,最终将所有拼接好的完整路径组成一个新的列表。

    我们可以把整段代码的阅读顺序做如下表达:

让我们继续解读:

  for imagePath in imagePaths:name = str(os.path.split(imagePath)[1].split('.',2)[1])names.append(name) 

for imagePath in imagePaths是在刚形成的imagePath列表里自己进行循环

(3)os.path.split()将一个文件路径拆分为目录部分和文件名部分。

  • 通过上一个代码我们获取了imagePath=M:/python/workspace/PythonProject/face/1.lss.jpg
  • os.path.split(imagePath)就是把M:/python/workspace/PythonProject/face/1.lss.jpg拆为:
  • 文件目录M:/python/workspace/PythonProject/face/
  • 文件名1.lss.jpg

os.path.split(imagePath)[1]是从文件目录和文件名中获取第二个文件名,即1.lss.jpg

补充:这里的第二个元素是因为列表、元组和字符串的索引都是从 0 开始,即[0]代表首位,[1]代表第二个,以此类推。

(4)split() 将字符串按照指定的分隔符分割成多个子字符串,并返回一个包含这些子字符串的列表

str.split(sep=None, maxsplit=-1)
  • sep:可选参数,指定分隔符。如果不提供该参数,默认使用空白字符(空格、制表符、换行符等)作为分隔符。
  • maxsplit:可选参数,指定最大分割次数。如果不提供该参数,表示不限制分割次数。

  • split('.', 2)的含义就是分隔符为 . 最多分隔2次。

  • '1.lss.jpg' 调用 split( ) 后,会得到列表 ['1', 'lss', 'jpg']

  • split('.',2)[1]这里从文件名1.lss.jpg中取出第二个元素,即lss

整行代码解读为:

(5)append()在列表的末尾添加一个新元素

list.append(object)
  • list:表示要操作的列表对象。
  • object:表示要添加到列表末尾的任意 Python 对象,比如字符串、整数、列表、元组等。

names.append(name)这里就是把开头创建的names列表填进了内容name

解读主函数:

内容我们都学过,就直接标注了

#打开视频test3.mp4读取每一帧
cap=cv2.VideoCapture('test3.mp4')
#调用自定义name函数
name()
while True:#读取视频里的帧flag,frame=cap.read()#如果没有帧则中断if not flag:break#调用自定义face_detect_demo函数,进行人脸识别和标注face_detect_demo(frame)if ord(' ') == cv2.waitKey(10):break

 (5)全部代码解读为:

import cv2
#导入与操作系统交互 os 模块
import os#创建一个 LBPH(局部二值模式直方图)人脸识别器对象,用于训练和识别人脸。
recogizer=cv2.face.LBPHFaceRecognizer_create()
#读取训练好的人脸识别模型yml文件
recogizer.read('M:/python/workspace/PythonProject/trainer/trainer.yml')
#初始化一个空列表names,用于存储人脸对应的名称。
names=[]
#初始化一个全局变量warningtime,用于记录未知人脸出现的次数。
warningtime = 1#自定义人脸识别
def face_detect_demo(img):#彩图转化为灰图gray=cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)#调用人脸识别分类器face_detector=cv2.CascadeClassifier('M:/python/pythoninstall/Lib/site-packages/cv2/data/haarcascade_frontalface_alt.xml')#灰图中检测人脸face=face_detector.detectMultiScale(gray)for x,y,w,h in face:#原彩图中用红色矩形框人脸cv2.rectangle(img,(x,y),(x+w,y+h),color=(0,0,255),thickness=2)#人脸中心画绿圆cv2.circle(img,center=(x+w//2,y+h//2),radius=w//2,color=(0,255,0),thickness=1)#识别输入人脸,获取标签ids,置信度confidenceids, confidence = recogizer.predict(gray[y:y + h, x:x + w])#如果置信度confidence>80if confidence > 80:#warningtime作为全局变量global warningtime#每次出现都+1warningtime += 1#控制台输出warningtime=,值为warningtimeprint('warningtime=',warningtime)#图像上绘制文本,文本是unknown,位置是x向右偏移10个像素。y向上偏移10个像素,字体无衬线,字体大小0.75,绿色cv2.putText(img, 'unknown', (x + 10, y - 10), cv2.FONT_HERSHEY_SIMPLEX, 0.75, (0, 255, 0), 1)else:#图像上绘制文本,文本是names列表中的,其余同上#坐标移动规律:+ 号撒腿右下跑,- 号转身左上飘cv2.putText(img,str(names[ids - 1]), (x + 10, y - 10), cv2.FONT_HERSHEY_SIMPLEX, 0.75, (0, 255, 0), 1)#弹出窗口名为resultcv2.imshow('result',img)#定义人脸名称
def name():#预学习照片存放位置path = 'M:/python/workspace/PythonProject/face/'#获取path路径下文件名,将文件名+路径拼接完整路径,将完整路径存到imagePaths中imagePaths=[os.path.join(path,f) for f in os.listdir(path)]for imagePath in imagePaths:#获取文件名中的一部分作为name,即name=lssname = str(os.path.split(imagePath)[1].split('.',2)[1])#将提取出的人脸名称 name 添加到 names 列表中names.append(name)#打开视频test3.mp4读取每一帧
cap=cv2.VideoCapture('test3.mp4')
#调用自定义name函数
name()
while True:#读取视频里的帧flag,frame=cap.read()#如果没有帧则中断if not flag:break#调用自定义face_detect_demo函数,进行人脸识别和标注face_detect_demo(frame)if ord(' ') == cv2.waitKey(10):breakcv2.destroyAllWindows()
cap.release()
print(names)

(6)人脸识别成功的要点

   本次识别我们用两张人像即实现了人脸识别,这有赖于LBPH分类器的局部特征特性,少量图片即可识别。同时在素材选择中刻意选择了差异较大的人物,且目标人像的角度基本一致而检测任务则为其他角度。如果想提升识别准确性目前我所了解的一个是提升训练样本量,更改分类器或者用其他方式进行识别。在实验中我尝试了用130多张图用LBPH分类器,但训练效果不佳。所以目前的成果对于材料的选择有较高的要求。

(7)补充[]和()的区别

  1. 方括号 [] 用于表示列表(list)。列表是一种可变的、有序的数据集合,列表支持元素的添加、删除、修改等操作
  2. 方括号 [] 用于索引和切片操作
my_list = [1, 'apple', True]my_list = [1, 2, 3, 4, 5]
# 索引操作,获取第一个元素
first_element = my_list[0]# 切片操作,获取第 2 到第 4 个元素
sub_list = my_list[1:4]
print(sub_list)  # 输出: [2, 3, 4]my_tuple = (1, 2, 3, 4, 5)
# 元组的索引操作
first_tuple_element = my_tuple[0]
print(first_tuple_element)  # 输出: 1squares = [i**2 for i in range(1, 6)]
  1. 圆括号 () 用于表示元组(tuple)。元组是一种不可变的、有序的数据集合,一旦创建就不能修改其元素
  2. 圆括号 () 用于函数调用。调用函数时,需要使用圆括号将参数括起来。如果函数不需要参数,也需要使用空的圆括号。
my_tuple = (1, 'apple', True)def greet(name):def say_hi():

综上大部分情况都使用圆括号()

(8)总结

  • os.path.join()协调文件路径中/\差异
  • os.listdir()输出某目录下所有文件名
  • os.path.split()将一个文件路径拆分为目录部分和文件名部分
  • split() 将字符串按照指定的分隔符分割成多个子字符串,并返回一个包含这些子字符串的列表
  • append()在列表的末尾添加一个新元素

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/19724.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

源代码防泄密沙箱是啥意思?

SDC沙盒通过多种技术手段实现环境隔离,从而有效防止数据泄露。以下是其具体的隔离机制: 1. 创建隔离的加密沙盒 SDC沙盒在员工电脑上虚拟出一个对外隔绝的加密沙盒。这个沙盒会主动与服务器进行认证对接,形成服务器-客户端沙盒这样一个涉密…

【复现DeepSeek-R1之Open R1实战】系列4:SFT和GRPO源码逐行深度解析(上)(3万字长文,从零开始到入门,包含详细的拓展基础知识)

目录 1 前言1.1 Open R1项目简介1.2 主要步骤1.3 原理图 2 基础知识2.1 Vocabulary和Tokenizer2.1.1 vocab.json, tokenizer.json, tokenizer_config.json2.1.2 什么是tokenizer2.1.3 在哪一步将tokenizer转成embedding2.1.4 tokenizer的代码实现 2.2 SFT和GRPO2.2.1 SFT2.2.2 …

课题推荐:高空长航无人机多源信息高精度融合导航技术研究

高空长航无人机多源信息高精度融合导航技术的研究,具有重要的理论意义与应用价值。通过深入研究多源信息融合技术,可以有效提升无人机在高空复杂环境下的导航能力,为无人机的广泛应用提供强有力的技术支持。希望该课题能够得到重视和支持&…

python_excel批量插入图片

提取excel的指定列的值的后4位(数值),在其它列名的单元格中,批量嵌入与该数值匹配的图片(未实现居中),每间隔4行处理一次(合并过单元格)。 import pandas as pd from ope…

DeepSeek 助力 Vue 开发:打造丝滑的颜色选择器(Color Picker)

前言:哈喽,大家好,今天给大家分享一篇文章!并提供具体代码帮助大家深入理解,彻底掌握!创作不易,如果能帮助到大家或者给大家一些灵感和启发,欢迎收藏关注哦 💕 目录 Deep…

Jenkinsdebug:遇到ERROR: unable to select packages:怎么处理

报错信息: 报错信息解释: musl-1.2.5-r0 和 musl-dev-1.2.5-r1: 这里说明 musl-dev 需要一个特定版本的 musl,即 musl1.2.5-r1,但是当前版本的 musl(1.2.5-r0)并不满足这个条件。版本冲突: 当尝试安装新…

并查集基础+优化(下标从0开始)

#include<iostream> #include<algorithm> #include<vector> using namespace std; const int N 1e510; int n,m; int fa[N]; void set(int u,int v) {fa[v] u; } int find(int arr[],int i) {while(arr[i] ! -1){i arr[i]; } return i;//返回的是这个节点…

STM32创建静态库lib

创建静态库lib 1. 新建工程1.1 创建工程文件夹1.2 编写用户相关代码1.2.1 stm32f4xx_it.h1.2.2 stm32f4xx_it.c1.2.3 标准库配置&#xff1a;stm32f4xx_conf.h1.2.4 HAL库的配置&#xff1a;stm32f4xx_hal_conf.h1.2.5 LL库配置&#xff1a;stm32f4xx_ll_conf.h 1.3 移植通用文…

CV -- 基于GPU版显卡CUDA环境+Pycharm YOLOv8 检测

目录 下载 CUDA 下载 cuDNN 下载 anaconda 安装 PyTorch pycharm 搭配 yolo 环境并运行 阅读本文须知&#xff0c;需要电脑中有 Nvidia 显卡 下载 CUDA 打开 cmd &#xff0c;输入 nvidia-smi &#xff0c;查看电脑支持 CUDA 版本&#xff1a; 我这里是12.0&#xff0c;进入…

MATLAB图像处理:图像分割方法

图像分割将图像划分为具有特定意义的子区域&#xff0c;是目标检测、医学影像分析、自动驾驶等领域的核心预处理步骤。本文讲解阈值分割、边缘检测、区域生长、聚类分割、基于图的方法等经典与前沿技术&#xff0c;提供MATLAB代码实现。 目录 1. 图像分割基础 2. 经典分割方…

海康摄像头IPV6模式,手动,自动,路由公告

海康摄像头DS-2DC7220IW-A 网络设置中的IPv6配置选项。IPv6是互联网协议&#xff08;IP&#xff09;的第六版&#xff0c;用于替代IPv4&#xff0c;提供更多的IP地址和改进的网络功能。图片中的选项允许用户选择如何配置设备的IPv6网络连接&#xff1a; 手动&#xff1a;用户可…

NewMap10.3土地勘测定界自动化系统

“NewMap报件通”适用于建设项目用地土地勘测定界工作&#xff0c;其设计理念是以最大化提高作业效率与最简化作业员操作为原则&#xff0c;后台采用数据库管理技术&#xff0c;以“GIS概念”实现了图形数据与属性数据的双向联动&#xff0c;利用该系统可以方便快捷地绘制数字化…

栈(典型算法思想)—— OJ例题算法解析思路

目录 一、1047. 删除字符串中的所有相邻重复项 - 力扣&#xff08;LeetCode&#xff09; 算法代码&#xff1a; 1. 初始化结果字符串 2. 遍历输入字符串 3. 检查和处理字符 4. 返回结果 总结 二、844. 比较含退格的字符串 - 力扣&#xff08;LeetCode&#xff09; 算…

Qt中基于开源库QRencode生成二维码(附工程源码链接)

目录 1.QRencode简介 2.编译qrencode 3.在Qt中直接使用QRencode源码 3.1.添加源码 3.2.用字符串生成二维码 3.3.用二进制数据生成二维码 3.4.界面设计 3.5.效果展示 4.注意事项 5.源码下载 1.QRencode简介 QRencode是一个开源的库&#xff0c;专门用于生成二维码&…

字符串哈希动态规划_6

一.字符串哈希 字符串哈希概述 字符串哈希是一种将字符串映射到一个数值的技术&#xff0c;常用于处理字符串相关的算法问题&#xff0c;尤其在处理字符串匹配、子串查找等问题时非常高效。它的核心思想是利用一个哈希函数将字符串映射成一个整数&#xff0c;并根据该整数来判…

Kubernetes控制平面组件:Kubernetes如何使用etcd

云原生学习路线导航页&#xff08;持续更新中&#xff09; kubernetes学习系列快捷链接 Kubernetes架构原则和对象设计&#xff08;一&#xff09;Kubernetes架构原则和对象设计&#xff08;二&#xff09;Kubernetes架构原则和对象设计&#xff08;三&#xff09;Kubernetes控…

Mybatis后端数据库查询多对多查询解决方案

问题场景&#xff1a; 我开发的是一个论文选择系统。 后端用一个论文表paper来存储论文信息。 论文信息中&#xff0c;包含前置课程&#xff0c;也就是你需要修过这些课程才能选择这个论文。 而一个论文对应的课程有很多个。 这样就造成了一个数据库存储的问题。一个paper…

BGP配置华为——RR反射器配置

实验拓扑 与之前实验同理将loop0作为routerID使用&#xff0c;且R1和R2上用loop1接口用于模拟用户其他网段 实验要求 1&#xff0c;在AS100内运行OSPF协议 2.配置路由反射器&#xff0c;使得从R1进入的数据能够反射到全局网络 3.在R1和R2上分别宣告自己的loop1口网段用于观…

CentOS7 离线安装 Postgresql 指南

一、背景 服务器通常都是离线内网环境&#xff0c;想要通过联网方式一键下载安装 Postgresql 不太现实&#xff0c;本文将介绍如何在 CentOS7 离线安装 Postgresql&#xff0c;以及遇到困难如何解决。 二、安装包下载 先在本地下载好 rpm 包&#xff0c;再通过 ftp 上传到服…

vue3项目实践心得-寻找未被使用的最小编号

&#x1f9e1;&#x1f9e1;遇到的问题&#x1f9e1;&#x1f9e1; 在用vue3ts编写编译原理项目中”绘制状态转换图“时&#xff0c;有一个添加状态的功能按钮&#xff0c;用户点击按钮即可添加一个新的状态&#xff0c;至于新的状态的编号值&#xff0c;想着以”最小未被使用…