YOLOv8目标检测(六)_封装API接口

YOLOv8目标检测(一)_检测流程梳理:YOLOv8目标检测(一)_检测流程梳理_yolo检测流程-CSDN博客

YOLOv8目标检测(二)_准备数据集:YOLOv8目标检测(二)_准备数据集_yolov8 数据集准备-CSDN博客

YOLOv8目标检测(三)_训练模型:YOLOv8目标检测(三)_训练模型_yolo data.yaml-CSDN博客

YOLOv8目标检测(三*)_最佳超参数训练:YOLOv8目标检测(三*)_最佳超参数训练_yolov8训练的超参数-CSDN博客

YOLOv8目标检测(四)_图片推理:YOLOv8目标检测(四)_图片推理-CSDN博客

YOLOv8目标检测(五)_结果文件(run/detrct/train)详解:YOLOv8目标检测(五)_结果文件(run/detrct/train)详解_yolo训练结果文件含义-CSDN博客

YOLOv8目标检测(六)_封装API接口:YOLOv8目标检测(六)_封装API接口-CSDN博客

在Python中将YOLOv8模型封装为API接口后,用户可以通过调用该接口上传自定义的测试图片,并获取识别结果

为什么要封装成API接口使用?

  • 模块化和可重用性:封装成API后,模型可以独立于其他代码运行,使得它更容易被其他应用或服务调用,而不需要直接依赖模型的具体实现细节。
  • 易于扩展:API接口可以方便地进行版本管理和功能扩展。如果未来需要替换或升级YOLOv8模型,可以通过修改API内部实现而不影响其他依赖该API的系统。
  • 跨平台兼容性:通过API,可以让不同平台或不同编程语言的应用访问和使用YOLOv8模型,而无需关心底层的实现细节。比如,前端应用可以通过HTTP请求访问API,得到模型的推理结果。
  • 简化部署与维护:API接口使得模型部署变得更加标准化和可管理。你可以将模型托管在服务器上,任何需要使用该模型的用户或系统都可以通过API进行交互,方便维护和监控。
  • 灵活性:API接口可以通过参数化设计,支持不同的输入输出形式,甚至可以根据请求动态调整模型的行为(如使用不同的推理参数、处理不同类型的输入等)。
  • 分离前后端:对于Web应用来说,封装成API接口可以将前端和后端分离,前端只需要通过HTTP请求和API进行交互,无需了解YOLOv8模型的具体实现。

注:笔者的情况是模型和API代码都在服务器(linux)Docker容器中,在容器中起服务,本地调用服务推理图片。

1.Python封装API

服务器中操作

app.py具体代码如下

import json
import numpy as np
from flask import Flask, request, jsonify
from loguru import logger
import base64
import cv2
from ultralytics import YOLOapp = Flask(__name__)# 只处理 base64 编码图像
def read_img_cv(base64_str):try:img_data = base64.b64decode(base64_str)img = np.frombuffer(img_data, np.uint8)return cv2.imdecode(img, cv2.IMREAD_COLOR)except Exception:return Nonedef invasion(xyxy, points):# 检查目标框中心是否在给定区域内center_x, center_y = (xyxy[0] + xyxy[2]) / 2, (xyxy[1] + xyxy[3]) / 2return any(point[0] < center_x < point[2] and point[1] < center_y < point[3] for point in points)# 设置日志记录
logger.add("./logs/{0}".format("log.log"), rotation="10 MB")# 自定义标签列表
custom_labels = {0: 'backpack',1: 'plastic bag',2: 'shoulder bag', 3: 'person',4: 'handbag',5: 'suitcase'# 根据你的标签数目和顺序调整
}# 参数设置
def set_parameters():return {'device': 'cuda', 'port': 5000}args = set_parameters()
logger.info("start load Model!")
model = YOLO('/your_path/best.pt')  # 修改为你自己的路径@app.route('/predict', methods=['POST'])
def predict():if request.method == 'POST':try:data = request.get_json()img_object = data.get('image')minScore = float(data.get('minScore', 0.45))maxScore = float(data.get('maxScore', 1.0))customerID = data.get('customerID')imageID = data.get('imageID')axisall = data.get('axis', [])# 校验置信度范围if not (0 <= minScore <= 1 and 0 <= maxScore <= 1 and minScore <= maxScore):return jsonify({'customerID': customerID, 'imageID': imageID, 'code': 1, 'msg': '置信度错误', "marks": None, "result": None})# 解码图像img0 = read_img_cv(img_object)if img0 is None:return jsonify({'customerID': customerID, 'imageID': imageID, 'code': 1, 'msg': '图片解码出错', "marks": None, "result": None})w, h = img0.shape[:2]if axisall:axisall = [[max(0, a[0]), max(0, a[1]), min(w, a[2]), min(h, a[3])] for a in axisall]det_list = []try:# 使用YOLO模型进行预测annos = model(img0, conf=minScore)annos = annos[0].boxes.data.clone().cpu().detach().tolist()if annos:for cls, *xyxy, conf in zip(np.array(annos)[:, -1], np.array(annos)[:, :-2], np.array(annos)[:, -2]):category = str(int(cls))# 映射到自定义标签custom_category = custom_labels.get(int(cls), "未知")x0, y0, x1, y1 = map(int, xyxy[0])info = {"cls": custom_category, "axis": [x0, y0, x1, y1], "score": round(conf, 2)}if axisall and not invasion(xyxy[0], axisall):continuedet_list.append(info)except Exception:return jsonify({'customerID': customerID, 'imageID': imageID, 'code': 1, 'msg': '内部错误', "marks": None, "result": None})out = {'customerID': customerID, 'imageID': imageID, 'code': 0, 'msg': 'OK', "marks": det_list, "result": bool(det_list)}logger.info(f'outputs: {out}')return jsonify(out)except Exception:return jsonify({'customerID': None, 'imageID': None, 'code': 1, 'msg': '未知错误', "marks": None, "result": None})if __name__ == "__main__":app.run(host='0.0.0.0', port=args['port'], debug=True)

2.起服务

服务器中操作

运行python app.py,成功截图如下:

3.推理

本地操作

也可以上传数据到你的服务器操作(参考https://blog.csdn.net/weixin_48870215/article/details/144425479?fromshare=blogdetail&sharetype=blogdetail&sharerId=144425479&sharerefer=PC&sharesource=weixin_48870215&sharefrom=from_link),那样需要频繁的导入导出,笔者觉得麻烦。

注:这个模型best.pt是检测人和背包的。

(1)准备测试图片

(2)请求服务器处理代码

client.py具体代码如下:

import os
import base64
import cv2
import requests
from pathlib import Path# 设置输入图片文件夹和输出文件夹
input_folder = r"D:\\Desktop/857"
output_folder = r"D:\\Desktop/857_123"
url = "<http://12.345.678.101:8888/predict>" #你的服务器ip和端口# 确保输出文件夹存在
os.makedirs(output_folder, exist_ok=True)# 类别颜色映射
class_colors = {"person": (0, 255, 0),  # 绿色"bag": (255, 0, 0),     # 蓝色"car": (0, 0, 255),     # 红色"phone": (255, 255, 0), # 黄色# 可以继续添加其他类别的颜色
}# 将图片转换为base64格式
def image_to_base64(image_path):with open(image_path, 'rb') as f:img_byte = f.read()img_b64 = base64.b64encode(img_byte)return img_b64.decode()# 从接口返回的结果画框和置信度
def draw_predictions(image, marks):for mark in marks:cls = mark["cls"]  # 获取类别x1, y1, x2, y2 = map(int, mark["axis"])  # 获取坐标score = mark["score"]  # 获取置信度label = f'{cls}: {score:.2f}'  # 标注类别和置信度# 获取类别颜色,如果没有指定颜色则使用默认颜色(白色)color = class_colors.get(cls, (255, 255, 255))# 画框cv2.rectangle(image, (x1, y1), (x2, y2), color, 5)font_scale = 0.8# 计算标签的大小label_size = cv2.getTextSize(label, cv2.FONT_HERSHEY_SIMPLEX, font_scale, 2)[0]label_x, label_y = x1, y1 - 10# 检查标签是否会超出图像或框的顶部if label_y - label_size[1] - 5 < 0:  label_y = y1 + 10  # 将标签位置调整到框的下方# 绘制背景色以便突出显示类别标签cv2.rectangle(image, (label_x, label_y - label_size[1] - 5), (label_x + label_size[0], label_y), color, -1)# 在框上方标注类别和置信度cv2.putText(image, label, (label_x, label_y - 5), cv2.FONT_HERSHEY_SIMPLEX, font_scale, (0, 0, 0), 2, cv2.LINE_AA)return image# 处理每一张图片
for image_name in os.listdir(input_folder):image_path = os.path.join(input_folder, image_name)# 跳过非图片文件if not image_name.lower().endswith(('.png', '.jpg', '.jpeg', '.bmp')):print(f"跳过非图片文件: {image_name}")continueprint(f'正在处理图片: {image_name}')try:# 读取图片并转换为base64image_base64 = image_to_base64(image_path)# 构建POST请求的JSON数据payload = {"customerID": "abc_123","imageID": image_name,"minScore": 0.35,"maxScore": 0.99,"timeStamp": "1234455","flexibleParams": "","image": image_base64}# 调用接口response = requests.post(url, json=payload, timeout=10)print("Response status code:", response.status_code)if response.status_code == 200:try:response_data = response.json()  # 尝试解析 JSON 数据print("Response JSON:", response_data)# 读取原始图片image = cv2.imread(image_path)# 获取并画出预测结果if response_data.get("marks"):image = draw_predictions(image, response_data["marks"])# 保存处理后的图片output_path = os.path.join(output_folder, image_name)cv2.imwrite(output_path, image)print(f"Processed and saved: {output_path}")except requests.exceptions.JSONDecodeError:print(f"JSON 解码失败,服务器返回内容: {response.text}")else:print(f"服务器返回错误状态码: {response.status_code}, 内容: {response.text}")except requests.exceptions.RequestException as e:print(f"请求失败: {e}")except Exception as e:print(f"处理图片时发生错误: {e}")

(3)查看结果

app.py服务器返回结果:

client返回结果:

图片返回结果:

看过这六期文章,恭喜你基本掌握了YOLOv8实战流程:数据处理、数据集制作、模型训练、API封装、调用API推理。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/491018.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Intel(R) Iris(R) Xe Graphics安装Anaconda、Pytorch(CPU版本)

一、Intel(R) Iris(R) Xe Graphics安装Anaconda 下载网址&#xff1a;https://repo.anaconda.com/archive/ 双击Anaconda3-2024.10-1-Windows-x86_64&#xff0c;一直下一步&#xff0c;选择安装的路径位置&#xff0c;一直下一步就安装完成了。打开Anaconda PowerShell Promp…

docker安装、升级、以及sudo dockerd --debug查看启动失败的问题

1、docker安装包tar下载地址 Index of linux/static/stable/x86_64/ 2、下载tgz文件并解压 tar -zxvf docker-24.0.8.tgz 解压后docker文件夹下位docker相关文件 3、将老版本docker相关文件&#xff0c;备份 将 /usr/bin/docker下docker相关的文件&#xff0c;mv到备份目录…

vue 对接百度地图,选择附近的点

安装依赖 npm install vue-baidu-map0.21.22 编写页面 <template><view class"nearLocation"><u-navbar :is-back"false" title"选择附近的点" title-color"black"><view style"padding-left: 20px;&quo…

详解排序几大算法

一、插入排序 基本思想&#xff1a; 直接插入排序是一种简单的插入排序算法&#xff0c;其基本思想是&#xff1a;把待排序的记录按其关键码值的大小逐个插入到一个已经排好序的有序序列中&#xff0c;直到所有的记录插入完为止&#xff0c;得到一个新的有序序列。 步骤&#x…

Unix 和 Windows 的有趣比较

Unix 和 Windows NT 比较 来源于这两本书&#xff0c;把两本书对照来读&#xff0c;发现很多有意思的地方&#xff1a; 《Unix 传奇》 https://book.douban.com/subject/35292726/ 《观止 微软创建NT和未来的夺命狂奔 》 Showstopper!: The Breakneck Race to Create Windows…

Android 系统应用重名install安装失败分析解决

Android 系统应用重名install安装失败分析解决 文章目录 Android 系统应用重名install安装失败分析解决一、前言1、Android Persistent apps 简单介绍 二、系统 persistent 应用直接安装需求分析解决1、系统应用安装报错返回的信息2、分析解决 三、其他1、persistent系统应用in…

【Unity基础】AudioSource 常用方法总结

在 Unity 中&#xff0c;AudioSource 组件用于控制音频的播放和管理。以下是常用的 AudioSource 控制方法及其说明。 1. 播放和暂停音频 Play()&#xff1a;开始播放音频&#xff0c;如果是从暂停的地方继续播放&#xff0c;可以直接调用。Pause()&#xff1a;暂停当前播放的…

【ADS射频电路学习笔记】2.阻抗匹配电路设计

本节课学习smith圆图匹配 1.史密斯圆图各功能介绍 首先调出s参数的控件 并增加两个端口 调出smith chart matching的控件 连接好端口在ADS中&#xff0c;默认是从负载端&#xff08;term2&#xff09;向源端&#xff08;term1&#xff09;做匹配的。 调节s参数控件的的频率扫…

01《Python数据分析》数据分析初探章节总结

目录 1 概述1.1 数据分析定义1.2 数据分析目标1.3 数据分析分类 2 数据分析方法3 数据分析流程4 寻找问题原因5 典型问题参考学习 1 概述 1.1 数据分析定义 数据分析1就是&#xff1a;用适当的统计分析方法对收集来的大量数据进行分析&#xff0c;提取有用信息和形成结论&…

杰理-LVGL-默认隐藏容器

杰理-LVGL-默认隐藏容器 lv_obj_add_flag(ui->screen_music_cont_tip, LV_OBJ_FLAG_HIDDEN)

软件需求概述(尊享版)

软件需求与软件分析 软件需求&#xff1a;用户角度&#xff0c;注重软件外在表现 软件分析&#xff1a;开发者角度&#xff0c;注重软件内部逻辑结构 面向对象分析模型 类/对象模型&#xff08;全部的类和对象&#xff09; 对象-关系模型&#xff08;对象之间的静态关系&…

将PDF流使用 canvas 绘制展示在页面上(一)

将PDF流展示在页面上 使用 pdfjs-dist 库来渲染 PDF 页面到 canvas 上进行绘制展示 安装 pdfjs-dist 依赖 npm install pdfjs-dist 或者 yarn add pdfjs-dist创建一个组件来处理 PDF 流的加载和渲染 该组件中是一个包含 PDF 文件的 Base64。 将 pdf 流传入该组件中使用 /** fo…

web遇到的安全漏洞

最近项目又在做安全漏扫&#xff0c;记录下遇到的常见的web安全问题 越权 漏洞介绍 攻击者可以在授权状态下&#xff0c;通过修改数据包的参数&#xff0c;操作超出现有权限操作的功能点。举例 修改密码时&#xff0c;可以通过修改名称参数&#xff0c;修改任意用户密码。 任…

12.11数据结构-图

无向完全图&#xff1a;在无向图中&#xff0c;如果任意两个顶点之间都存在边&#xff0c;则称该图为无向完全图。 有向完全图&#xff1a;在有向图中&#xff0c;如果任意两个顶点之间都存在方向相反的两条弧&#xff0c;则称该图为有向完全图。 含有n个顶点的无向完全图有…

【Python】【数据分析】深入探索 Python 数据可视化:Matplotlib 绘图库完整教程

目录 引言一、什么是 Matplotlib&#xff1f;1.1 Matplotlib 的安装1.2 Matplotlib 的基本功能 二、Matplotlib 的基础绘图2.1 绘制折线图2.2 绘制柱状图2.3 绘制散点图2.4 绘制饼图 三、高级功能与定制3.1 设置图表样式3.2 使用子图3.3 保存图表 四、Matplotlib 流程图4.1 Mer…

3-机器人视觉-机器人抓取与操作

文章目录 3机器人视觉目录 1. 传感器和标定摄像头模型Intrinsic MatrixExtrinsic Matrix 标定内参标定手眼标定和外参标定 力传感器&其它传感器其它传感器 2. 神经网络和图像处理2D特征处理常见架构 训练流程推理流程部署流程2D 图像任务3D Point Cloud FeaturePointNet Ap…

从源码层级深入探索 Spring AMQP 如何在 Spring Boot 中实现 RabbitMQ 集成——消费者如何进行消费

本章节主要从底层源码探索Spring Boot中RabbitMQ如何进行消费&#xff0c;至于RabbitMQ是如何使用如何生产消息&#xff0c;本章不做过多介绍&#xff0c;感兴趣的小伙伴可以参考&#xff1a;从源码层级深入探索 Spring AMQP 如何在 Spring Boot 中实现 RabbitMQ 集成——生产者…

修改vscode中emmet中jsx和tsx语法中className的扩展符号从单引号到双引号 - HTML代码补全 - 单引号双引号

效果图 实现步骤 文件 > 首选项 > 设置搜索“”在settings.json中修改&#xff0c;增加 "emmet.syntaxProfiles": {"html": {"attr_quotes": "single"},"jsx": {"attr_quotes": "double","…

【小白51单片机专用教程】protues仿真AT89C51入门

课程特点 无需开发板0基础教学软件硬件双修辅助入门 本课程面对纯小白&#xff0c;因此会对各个新出现的知识点在实例基础上进行详细讲解&#xff0c;有相关知识的可以直接跳过。课程涉及protues基本操作、原理图设计、数电模电、kell使用、C语言基本内容&#xff0c;所有涉及…

ARMS 用户体验监控正式发布原生鸿蒙应用 SDK

作者&#xff1a;羿莉 背景 对企业数据进行敏感数据扫描和保护可以提升企业或组织的数据安全。一方面敏感数据可能包括个人身份信息、财务记录、医疗记录等&#xff0c;定期扫描这些数据可以防止未经授权的访问和泄露。 另一方面&#xff0c;许多国家和地区都有关于数据保护的…