Springboot 整合 Java DL4J 实现企业门禁人脸识别系统

🧑 博主简介:历代文学网(PC端可以访问:https://literature.sinhy.com/#/literature?__c=1000,移动端可微信小程序搜索“历代文学”)总架构师,15年工作经验,精通Java编程高并发设计Springboot和微服务,熟悉LinuxESXI虚拟化以及云原生Docker和K8s,热衷于探索科技的边界,并将理论知识转化为实际应用。保持对新技术的好奇心,乐于分享所学,希望通过我的实践经历和见解,启发他人的创新思维。在这里,我希望能与志同道合的朋友交流探讨,共同进步,一起在技术的世界里不断学习成长。

在这里插入图片描述


在这里插入图片描述

Spring Boot 整合 Deeplearning4j 实现企业门禁人脸识别系统

一、引言

在当今数字化时代,企业对于安全性和效率的要求越来越高。传统的门禁系统如钥匙、密码等存在易丢失易被破解等问题。而人脸识别技术作为一种非接触式高效准确的身份验证方式,正逐渐成为企业门禁系统的首选。本文将详细介绍如何使用 Spring Boot 整合 Java Deeplearning4j 实现一个企业门禁人脸识别系统,通过识别员工面部特征实现快速身份验证,提高安全性通行效率

二、神经网络选择

本案例中我们选择使用卷积神经网络(Convolutional Neural NetworkCNN)来实现人脸识别。CNN 是一种专门用于处理图像数据的神经网络,具有以下优点:

  • 能够自动提取图像的特征,减少了人工特征提取的工作量。
  • 对图像的平移、旋转、缩放等具有一定的不变性,提高了识别的准确性。
  • 可以处理大规模的图像数据,适用于企业门禁系统中可能出现的大量员工面部图像。

选择理由

  • 人脸识别是一个复杂的任务,需要对图像中的面部特征进行准确的提取和识别。CNN 能够自动学习图像的特征,并且在图像识别领域取得了非常好的效果。
  • 企业门禁系统需要快速准确地识别员工的面部特征,以提高通行效率。CNN 可以在较短的时间内对图像进行处理,满足企业门禁系统的实时性要求。
  • 随着深度学习技术的不断发展,CNN 的性能不断提高,并且有很多成熟的开源框架和工具可以使用,如 Deeplearning4j,使得开发人脸识别系统变得更加容易。

三、数据集格式

  1. 数据集来源:我们可以使用公开的人脸识别数据集,如 Labeled Faces in the Wild(LFW)数据集,也可以自己收集企业员工的面部图像构建数据集。
  2. 数据集格式:数据集通常以图像文件的形式存储,每个图像文件对应一个员工的面部图像。图像文件可以是 JPEG、PNG 等常见的图像格式。为了方便管理和使用数据集,我们可以将图像文件按照员工的编号或姓名进行命名,并将其存储在一个特定的目录中。例如,我们可以创建一个名为“dataset”的目录,然后在该目录下创建多个子目录,每个子目录对应一个员工,子目录中的图像文件即为该员工的面部图像。
  3. 数据集表格示例
员工编号员工姓名图像文件路径
001张三dataset/001/face1.jpg
001张三dataset/001/face2.jpg
002李四dataset/002/face1.jpg
002李四dataset/002/face2.jpg

四、技术介绍

  1. Spring BootSpring Boot 是一个基于 Spring 框架的快速开发框架,它简化了 Spring 应用的开发过程,使得开发者可以更加专注于业务逻辑的实现。在本案例中,我们使用 Spring Boot 来构建企业门禁系统的后端服务,实现人脸识别的业务逻辑。
  2. Deeplearning4jDeeplearning4j 是一个基于 Java 的深度学习框架,它支持多种神经网络模型,如 CNN、循环神经网络(Recurrent Neural NetworkRNN)等。在本案例中,我们使用 Deeplearning4j 来训练和部署人脸识别模型。
  3. 图像预处理:在进行人脸识别之前,我们需要对图像进行预处理,包括图像的缩放、裁剪、归一化等操作,以提高模型的识别准确性。
  4. 模型训练:使用 Deeplearning4j 提供的 API,我们可以构建和训练人脸识别模型。在训练过程中,我们需要将数据集分为训练集和测试集,使用训练集对模型进行训练,使用测试集对模型的性能进行评估。
  5. 模型部署:训练好的模型可以部署到企业门禁系统中,实现人脸识别的功能。在部署过程中,我们需要将模型转换为适合在生产环境中运行的格式,并使用 Spring Boot 提供的 RESTful API 将模型暴露给前端应用。

五、相关Maven 依赖

在使用 Spring Boot 整合 Deeplearning4j 实现企业门禁人脸识别系统时,我们需要添加以下 Maven 依赖:

<dependency><groupId>org.deeplearning4j</groupId><artifactId>deeplearning4j-core</artifactId><version>1.0.0-beta7</version>
</dependency>
<dependency><groupId>org.deeplearning4j</groupId><artifactId>deeplearning4j-nn</artifactId><version>1.0.0-beta7</version>
</dependency>
<dependency><groupId>org.deeplearning4j</groupId><artifactId>deeplearning4j-ui</artifactId><version>1.0.0-beta7</version>
</dependency>
<dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-web</artifactId>
</dependency>

六、代码示例

6.1 图像预处理

import org.deeplearning4j.nn.graph.ComputationGraph;
import org.deeplearning4j.nn.modelimport.keras.KerasModelImport;
import org.deeplearning4j.nn.transferlearning.FineTuneConfiguration;
import org.deeplearning4j.nn.transferlearning.TransferLearning;
import org.deeplearning4j.zoo.ZooModel;
import org.deeplearning4j.zoo.model.VGG16;
import org.nd4j.linalg.dataset.api.preprocessor.DataNormalization;
import org.nd4j.linalg.dataset.api.preprocessor.ImagePreProcessingScaler;
import org.nd4j.linalg.factory.Nd4j;
import org.slf4j.Logger;
import org.slf4j.LoggerFactory;import javax.imageio.ImageIO;
import java.awt.image.BufferedImage;
import java.io.File;
import java.io.IOException;public class ImagePreprocessor {private static final Logger logger = LoggerFactory.getLogger(ImagePreprocessor.class);public static double[] preprocessImage(String imagePath) {try {BufferedImage image = ImageIO.read(new File(imagePath));int width = 224;int height = 224;BufferedImage resizedImage = new BufferedImage(width, height, BufferedImage.TYPE_INT_RGB);resizedImage.getGraphics().drawImage(image, 0, 0, width, height, null);double[] pixels = new double[width * height * 3];for (int y = 0; y < height; y++) {for (int x = 0; x < width; x++) {int argb = resizedImage.getRGB(x, y);int r = (argb >> 16) & 0xff;int g = (argb >> 8) & 0xff;int b = argb & 0xff;pixels[y * width * 3 + x * 3] = r / 255.0;pixels[y * width * 3 + x * 3 + 1] = g / 255.0;pixels[y * width * 3 + x * 3 + 2] = b / 255.0;}}DataNormalization scaler = new ImagePreProcessingScaler(0, 1);scaler.transform(Nd4j.create(pixels));return pixels;} catch (IOException e) {logger.error("Error preprocessing image: {}", e.getMessage());return null;}}
}

这段代码实现了对图像的预处理功能,包括图像的缩放、归一化等操作。首先,我们使用ImageIO读取图像文件,并将其缩放到指定的大小。然后,我们将图像的像素值转换为double类型,并进行归一化处理,使得像素值在 0 到 1 之间。

6.2 模型训练

import org.deeplearning4j.nn.graph.ComputationGraph;
import org.deeplearning4j.nn.modelimport.keras.KerasModelImport;
import org.deeplearning4j.nn.transferlearning.FineTuneConfiguration;
import org.deeplearning4j.nn.transferlearning.TransferLearning;
import org.deeplearning4j.zoo.ZooModel;
import org.deeplearning4j.zoo.model.VGG16;
import org.nd4j.linalg.dataset.api.iterator.DataSetIterator;
import org.nd4j.linalg.dataset.api.preprocessor.DataNormalization;
import org.nd4j.linalg.dataset.api.preprocessor.ImagePreProcessingScaler;
import org.nd4j.linalg.factory.Nd4j;
import org.slf4j.Logger;
import org.slf4j.LoggerFactory;import java.io.File;
import java.util.ArrayList;
import java.util.List;public class FaceRecognitionTrainer {private static final Logger logger = LoggerFactory.getLogger(FaceRecognitionTrainer.class);public static ComputationGraph trainModel(String datasetPath, int numClasses) {try {// 加载预训练的 VGG16 模型ZooModel zooModel = VGG16.builder().build();ComputationGraph vgg16 = (ComputationGraph) zooModel.initPretrained();// 设置微调配置FineTuneConfiguration fineTuneConf = new FineTuneConfiguration.Builder().updater("sgd").learningRate(0.001).seed(123).build();// 进行迁移学习ComputationGraph model = new TransferLearning.GraphBuilder(vgg16).fineTuneConfiguration(fineTuneConf).setFeatureExtractor("fc2").removeVertexKeepConnections("predictions").addLayer("predictions",org.deeplearning4j.nn.conf.layers.OutputLayer.builder().nIn(4096).nOut(numClasses).activation("softmax").build()).build();// 加载数据集List<double[]> images = new ArrayList<>();List<Integer> labels = new ArrayList<>();File datasetDir = new File(datasetPath);for (File employeeDir : datasetDir.listFiles()) {int label = Integer.parseInt(employeeDir.getName());for (File imageFile : employeeDir.listFiles()) {double[] pixels = ImagePreprocessor.preprocessImage(imageFile.getAbsolutePath());if (pixels!= null) {images.add(pixels);labels.add(label);}}}// 创建数据集迭代器DataSetIterator iterator = new FaceRecognitionDataSetIterator(images, labels);// 训练模型model.fit(iterator);return model;} catch (Exception e) {logger.error("Error training model: {}", e.getMessage());return null;}}
}

这段代码实现了对人脸识别模型的训练功能。首先,我们加载预训练的 VGG16 模型,并设置微调配置。然后,我们使用迁移学习的方法,将预训练的模型进行微调,以适应人脸识别的任务。接着,我们加载数据集,并创建数据集迭代器。最后,我们使用迭代器对模型进行训练。

6.3 模型部署

import org.deeplearning4j.nn.graph.ComputationGraph;
import org.deeplearning4j.zoo.ZooModel;
import org.deeplearning4j.zoo.model.VGG16;
import org.nd4j.linalg.dataset.api.iterator.DataSetIterator;
import org.nd4j.linalg.factory.Nd4j;
import org.slf4j.Logger;
import org.slf4j.LoggerFactory;
import org.springframework.boot.SpringApplication;
import org.springframework.boot.autoconfigure.SpringBootApplication;
import org.springframework.http.HttpStatus;
import org.springframework.http.ResponseEntity;
import org.springframework.web.bind.annotation.PostMapping;
import org.springframework.web.bind.annotation.RequestParam;
import org.springframework.web.bind.annotation.RestController;
import org.springframework.web.multipart.MultipartFile;import java.io.File;
import java.io.IOException;@SpringBootApplication
@RestController
public class FaceRecognitionApplication {private static final Logger logger = LoggerFactory.getLogger(FaceRecognitionApplication.class);private ComputationGraph model;public static void main(String[] args) {SpringApplication.run(FaceRecognitionApplication.class, args);}@PostMapping("/recognize")public ResponseEntity<String> recognizeFace(@RequestParam("image") MultipartFile imageFile) {try {// 加载模型(如果尚未加载)if (model == null) {model = FaceRecognitionTrainer.trainModel("dataset", 10);}// 保存上传的图像文件File tempFile = File.createTempFile("temp", ".jpg");imageFile.transferTo(tempFile);// 预处理图像double[] pixels = ImagePreprocessor.preprocessImage(tempFile.getAbsolutePath());// 进行人脸识别int prediction = predictFace(pixels);// 返回识别结果return new ResponseEntity<>("Recognized face as employee " + prediction, HttpStatus.OK);} catch (IOException e) {logger.error("Error recognizing face: {}", e.getMessage());return new ResponseEntity<>("Error recognizing face", HttpStatus.INTERNAL_SERVER_ERROR);}}private int predictFace(double[] pixels) {double[] output = model.outputSingle(pixels);int prediction = Nd4j.argMax(output).getInt(0);return prediction;}
}

这段代码实现了将训练好的人脸识别模型部署为一个 RESTful API 的功能。我们使用 Spring Boot 构建了一个后端服务,并在服务中加载训练好的模型。当接收到前端应用上传的图像文件时,我们对图像进行预处理,并使用模型进行人脸识别。最后,我们将识别结果返回给前端应用。

七、单元测试

7.1 图像预处理测试

import org.junit.jupiter.api.Test;
import static org.junit.jupiter.api.Assertions.assertNotNull;public class ImagePreprocessorTest {@Testpublic void testPreprocessImage() {double[] pixels = ImagePreprocessor.preprocessImage("test.jpg");assertNotNull(pixels);}
}

这段代码对图像预处理功能进行了单元测试。我们使用一个测试图像文件,并调用ImagePreprocessor.preprocessImage方法对图像进行预处理。然后,我们检查返回的像素数组是否不为空。

7.2 模型训练测试

import org.junit.jupiter.api.Test;
import static org.junit.jupiter.api.Assertions.assertNotNull;public class FaceRecognitionTrainerTest {@Testpublic void testTrainModel() {ComputationGraph model = FaceRecognitionTrainer.trainModel("dataset", 10);assertNotNull(model);}
}

这段代码对模型训练功能进行了单元测试。我们使用一个测试数据集,并调用FaceRecognitionTrainer.trainModel方法对模型进行训练。然后,我们检查返回的模型是否不为空。

7.3 模型部署测试

import org.junit.jupiter.api.Test;
import org.springframework.boot.test.context.SpringBootTest;
import org.springframework.http.HttpStatus;
import org.springframework.http.ResponseEntity;
import org.springframework.mock.web.MockMultipartFile;
import java.io.FileInputStream;
import java.io.IOException;
import static org.junit.jupiter.api.Assertions.assertEquals;@SpringBootTest
public class FaceRecognitionApplicationTest {@Testpublic void testRecognizeFace() throws IOException {FaceRecognitionApplication application = new FaceRecognitionApplication();FileInputStream fis = new FileInputStream("test.jpg");MockMultipartFile imageFile = new MockMultipartFile("image", "test.jpg", "image/jpeg", fis);ResponseEntity<String> response = application.recognizeFace(imageFile);assertEquals(HttpStatus.OK, response.getStatusCode());}
}

这段代码对模型部署功能进行了单元测试。我们使用一个测试图像文件,并模拟前端应用上传图像文件的请求。然后,我们检查返回的响应状态码是否为 200(OK)

八、预期输出

  1. 图像预处理:经过图像预处理后,图像的像素值应该在 0 到 1 之间,并且图像的大小应该符合模型的输入要求。
  2. 模型训练:在模型训练过程中,我们可以观察到模型的损失函数和准确率的变化情况。随着训练的进行,损失函数应该逐渐减小,准确率应该逐渐提高。
  3. 模型部署:当我们上传一张员工的面部图像时,后端服务应该能够快速准确地识别出该员工的身份,并返回相应的识别结果。

九、参考资料文献

  1. Deeplearning4j 官方文档
  2. Spring Boot 官方文档
  3. 卷积神经网络介绍
  4. 人脸识别技术介绍

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/444919.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

vue后台管理系统从0到1(3)element plus 的三种导入方式

文章目录 vue后台管理系统从0到1&#xff08;3&#xff09;element plus 的三种导入方式element plus 引入方式完整引入按需导入手动导入 vue后台管理系统从0到1&#xff08;3&#xff09;element plus 的三种导入方式 element plus 引入方式 官方网址&#xff1a;https://el…

windows系统更新升级node指定版本【避坑篇!!!亲测有效】(附带各版本node下载链接)一定看到最后!不用删旧版!

Node.js 是一个开源、跨平台的 JavaScript 运行时环境&#xff0c;广泛应用于服务器端和网络应用的开发。随着 Node.js 版本的不断更新&#xff0c;我们可能需要升级到特定版本以满足项目需求或修复安全漏洞。又或者是学习开发另外一个新项目&#xff0c;新项目对Node版本要求更…

优达学城 Generative AI 课程2:Large Language Models (LLMs) Text Generation

建议先了解一下附录知识。 文章目录 1 官方课程内容自述Lesson 1: 大型语言模型&#xff08;LLMs&#xff09;简介Lesson 2: 自然语言处理&#xff08;NLP&#xff09;基础Lesson 3: Transformer 和注意力机制Lesson 4: 检索增强生成&#xff08;RAG&#xff09;Lesson 5: 为大…

查找企业联系电话的几种方法

在商业合作和销售拓展的过程中&#xff0c;找到企业的联系电话是至关重要的一步。无论是精准营销还是客户开发&#xff0c;拥有有效的联系方式可以大大提高成功率。那么&#xff0c;如何快速有效地查找企业联系电话呢&#xff1f;下面介绍几种常见的方法&#xff0c;以及如何借…

如何解决项目跟进中关键节点难以把控的问题?

在项目跟进的过程中&#xff0c;关键节点的把控常常是一个棘手的问题。如果不能有效地管理这些节点&#xff0c;项目可能会偏离轨道&#xff0c;导致延误、成本超支甚至失败。下面我们来分析一下都有哪些关键节点难以把控以及相应的应对策略。 1、需求变更节点 在项目进行中&a…

快速入门Tomcat服务(业务发布基础技能)

文章目录 1 Tomcat简介 2 安装tomcat 2.1 安装jdk 2.2 安装Tomcat 3 Tomcat目录结构 4 Tomcat重要配置文件 1 Tomcat简介 Tomcat是Sun公司官方推荐的Servlet和JSP容器&#xff0c;在中小型系统和并发访问用户不是很多的场合下&#xff0c;其作为轻量级应用服务…

无刷直流电机工作原理:【图文讲解】

电动机 (俗称马达) 是机械能与电能之间转换装置的通称。可以分为电动机和发电机.一般称电机时就是指电动机。这个在日常应用中&#xff0c;比较多见&#xff0c;比如机器人&#xff0c;手机&#xff0c;电动车等。 直流电机&#xff1a;分为有刷直流电机&#xff08;BDC&#…

HTTP的工作原理

HTTP&#xff08;Hypertext Transfer Protocol&#xff09;是一种用于在计算机网络上传输超文本数据的应用层协议。它是构成万维网的基础之一&#xff0c;被广泛用于万维网上的数据通信。&#xff08;超文本(Hypertext)是用超链接的方法&#xff0c;将各种不同空间的文字信息组…

【MySQL】CRUD增删改查操作

文章目录 CRUD简介一、Creat 新增1.单行数据全列插入2.单行数据全指定列插入3.多行数据指定列插入 二、Retrieve 检索1.全列查询 --练习阶段最简单的查询&#xff1a;&#xff08;在生产环境最好不要用&#xff01;&#xff01;&#xff09;2.指定列查询3.结果去重查询4.where条…

柒拾伍- AI内容农场生产文章自动发布至公众号 (一)

一、内容农场 X AI 看过很多的新闻说 AI 产生 内容 污染网络&#xff0c;我也想试一下到底能污染成怎样。 然后为了编写爆款的内容&#xff0c;我选用这个 内容农场 的种子是来源于 微博热搜&#xff0c;让生长出来的垃圾文章更加火爆 涉及内容不能放 二、编写代码 关于代…

常用类(一)----包装类的使用和分析

文章目录 1.包装类2.课堂测试题3.包装类方法4.Integer创建机制5.Integer面试题 1.包装类 概念&#xff1a;基本数据类型对应的类就是包装类&#xff0c;就是为了把基本数据类型转换为包装类&#xff0c;使用这个类里面的方法操作数据----装箱的过程&#xff1b; //装箱&#…

springboot查询全部部门流程

前端发送请求后&#xff0c;会请求DeptController的方法list()。 package com.intelligent_learning_aid_system.controller;import com.intelligent_learning_aid_system.pojo.Dept; import com.intelligent_learning_aid_system.pojo.Result; import com.intelligent_learni…

ArcGis JS天地图 暗色地图

方法一&#xff1a;使用css filter 在body下增加svg&#xff0c;并增加需要用到的滤镜&#xff0c;这边用到x-rays <svg id"svgfilters" aria-hidden"true" style"position: absolute; width: 0; height: 0; overflow: hidden"version"…

Kafka-初识

一、Kafka是什么&#xff1f; Kafka是一个高度可扩展、弹性、容错和安全的分布式流处理平台&#xff0c;由服务器和客户端组成&#xff0c;通过高性能TCP网络协议进行通信。它可以像消息队列一样生产和消费数据。可以部署在裸机硬件、虚拟机和容器上&#xff0c;也可以部署在本…

鼠标市场洞察:数据分析揭示消费趋势!

鼠标整体数据分析 一. 概述 本报告基于从淘宝商品搜索接口和淘宝精确月销量接口中提取的数据&#xff0c;分析了前百个品牌在销售额上的占比情况。分析涵盖了销售额和占比的数据&#xff0c;为决策提供了依据。(以上两个接口有需求的可以找我要链接&#xff09; 1. 大盘整体…

基于Python flask的豆瓣电影可视化系统,豆瓣电影爬虫系统

博主介绍&#xff1a;✌Java徐师兄、7年大厂程序员经历。全网粉丝13w、csdn博客专家、掘金/华为云等平台优质作者、专注于Java技术领域和毕业项目实战✌ &#x1f345;文末获取源码联系&#x1f345; &#x1f447;&#x1f3fb; 精彩专栏推荐订阅&#x1f447;&#x1f3fb; 不…

ppt压缩文件怎么压缩?压缩PPT文件的多种压缩方法

ppt压缩文件怎么压缩&#xff1f;当文件体积过大时&#xff0c;分享和传输就会变得困难。许多电子邮件服务对附件的大小有限制&#xff0c;而在网络环境不佳时&#xff0c;上传和下载大文件可能耗时较长。此外&#xff0c;在不同设备上播放时&#xff0c;较大的PPT文件还可能导…

基于FPGA的以太网设计(一)

以太网简介 以太网&#xff08;Ethernet&#xff09;是一种计算机局域网技术。IEEE组织的IEEE 802.3标准制定了以太网的技术标准&#xff0c;它规定了包括物理层的连线、电子信号和介质访问控制的内容。以太网是目前应用最普遍的局域网技术&#xff0c;取代了其他局域网标准如…

GA-BP回归预测 | MATLAB实现GA-BP多输入单输出回归预测

回归预测 | MATLAB实现GA-BP多输入单输出回归预测 目录 回归预测 | MATLAB实现GA-BP多输入单输出回归预测预测效果基本介绍模型描述遗传算法神经网络GA-BP网络程序设计学习总结参考资料预测效果 基本介绍 MATLAB实现GA-BP多输入单输出回归预测,输入7个特征,输出1个,优化权重…

指针——数组(指针)传参

&#xff08;一&#xff09;前文问题答案解析 1、代码 int(*pa[10])[5] 的解析 某人&#xff1a;嗯&#xff0c;有*pa&#xff0c;这不很明显是个指针嘛&#xff0c;然后 [5] 说明是个数组指针&#xff0c;int类型&#xff0c;[10]。。。。 这这这&#xff0c;很明显不是指针。…