《深度学习》—— 模型部署

文章目录

    • 模型部署
    • 模型准备
    • 选择部署平台
    • 部署配置与服务化
    • 测试与验证
    • 优化与维护
    • 常用工具与框架
    • Flask本地部署模型

模型部署

模型部署是将训练好的机器学习或深度学习模型投入实际生产环境,使其能够处理实时数据并提供预测或推理服务的过程。

模型准备

  • 模型格式转换:将训练好的模型(如 TensorFlow、PyTorch、Keras 等框架的格式)转换为适合部署的格式,例如:
    • TensorFlow:.pb(冻结图)或 SavedModel 格式。
    • PyTorch:.pt或 TorchScript 格式。
    • 通用格式:ONNX(开放神经网络交换格式),便于跨框架部署。
  • 模型优化:
    • 压缩(如剪枝、量化)以减少模型大小和计算开销。
    • 加速(如使用 TensorRT、OpenVINO 等工具优化推理速度)。

选择部署平台

  • 根据应用场景和需求,选择合适的部署方式:
  • 云服务部署:
    • 使用云平台(如 AWS SageMaker、Google AI Platform、阿里云机器学习 PAI)提供的托管服务,快速部署 API。
    • 优点:无需管理底层基础设施,高可用性和可扩展性。
  • 本地服务器 / 私有云:
    • 将模型部署到公司内部服务器或私有云环境,适合对数据隐私要求高的场景。
    • 工具:TensorFlow Serving、PyTorch Serve、Flask/FastAPI 搭建自定义 API。
  • 边缘设备部署:
    • 在嵌入式设备(如手机、IoT 设备)或边缘服务器上部署轻量级模型。
    • 工具:TensorFlow Lite、ONNX Runtime、NCNN 等。

部署配置与服务化

  • 构建 API 服务:
    • 将模型封装为 RESTful 或 gRPC API,接收输入数据并返回预测结果。
    • 框架:Flask、FastAPI(Python),Spring Boot(Java)等。
  • 容器化:
    • 使用 Docker 将模型和依赖打包成容器,确保环境一致性。
    • 通过 Kubernetes 进行容器编排,实现负载均衡和自动扩展。
  • 服务监控:
    • 监控 API 的性能(如延迟、吞吐量)、错误率和资源使用情况。
    • 工具:Prometheus、Grafana、ELK Stack 等。

测试与验证

  • 功能测试:验证模型在不同输入下的输出是否符合预期。
  • 性能测试:评估模型在高并发请求下的推理速度和稳定性。
  • 压力测试:模拟极端负载,确保系统具备足够的容错能力。

优化与维护

  • 性能调优:
    • 通过硬件加速(GPU/TPU)、模型优化或算法优化提升推理速度。
    • 缓存高频请求结果,减少重复计算。
  • 模型更新:
    • 定期更新模型以适应数据分布变化(如模型漂移)。
    • 采用蓝绿部署或金丝雀发布等策略,确保服务无缝升级。
  • 安全与合规:
    • 对 API 进行身份验证和授权,防止未授权访问。
    • 加密传输数据(如 HTTPS),保护用户隐私。

常用工具与框架

  • 模型服务:TensorFlow Serving、PyTorch Serve、Seldon Core。
  • 轻量级推理:TensorFlow Lite、ONNX Runtime、MNN。
  • 容器与编排:Docker、Kubernetes。
  • 监控与日志:Prometheus、Grafana、ELK。

Flask本地部署模型

配置本地模型(服务端):

import io
import flask
import torch
import torch.nn.functional as F
from PIL import Image
from torch import nn
from torchvision import transforms, models, datasets# 创建一个Flask应用实例
app = flask.Flask(__name__)# 初始化模型变量,用于后续存储加载的模型
model = None
# 动态检查GPU是否可用,若可用则使用GPU进行计算
use_gpu = torch.cuda.is_available()def load_model():"""加载预训练的ResNet18模型并进行初始化"""global model# 初始化ResNet18模型,不使用预训练权重model = models.resnet18(pretrained=False)# 获取全连接层的输入特征数量num_ftrs = model.fc.in_features# 修改全连接层,使其输出102个类别model.fc = nn.Sequential(nn.Linear(num_ftrs, 102))try:# 加载模型的检查点文件,根据GPU可用性选择加载设备checkpoint = torch.load(r'D:\where-python\python-venv\深度学习\模型部署\best.pth',map_location=torch.device('cuda' if use_gpu else 'cpu'))# 加载模型的状态字典model.load_state_dict(checkpoint['state_dict'])# 将模型设置为评估模式,关闭一些在训练时使用的特殊层(如Dropout)model.eval()# 如果GPU可用,将模型移动到GPU上if use_gpu:model = model.cuda()except Exception as e:# 若加载模型时出现异常,打印错误信息并抛出异常print(f"模型加载失败: {str(e)}")raisedef prepare_image(image, target_size):"""对输入的图像进行预处理,使其符合模型的输入要求:param image: 输入的图像:param target_size: 目标图像尺寸:return: 预处理后的图像张量"""try:# 如果图像不是RGB模式,将其转换为RGB模式if image.mode != 'RGB':image = image.convert('RGB')# 定义图像预处理的转换操作transform = transforms.Compose([# 调整图像大小到目标尺寸transforms.Resize(target_size),# 将图像转换为张量transforms.ToTensor(),# 对图像进行归一化处理transforms.Normalize([0.485, 0.456, 0.406], [0.229, 0.224, 0.225])])# 应用预处理操作image = transform(image).unsqueeze(0)# 如果GPU可用,将图像张量移动到GPU上if use_gpu:image = image.cuda()return imageexcept Exception as e:# 若图像预处理过程中出现异常,打印错误信息并抛出异常print(f"图像预处理失败: {str(e)}")raise@app.route('/predict', methods=['POST'])
def predict():"""处理预测请求,接收图像并返回预测结果:return: 包含预测结果的JSON响应"""# 初始化响应数据,默认预测失败data = {'success': False, 'message': ''}try:# 检查请求方法是否为POSTif flask.request.method != 'POST':data['message'] = '仅支持POST请求'return flask.jsonify(data)# 检查请求中是否包含图像文件if 'image' not in flask.request.files:data['message'] = '未提供图像文件'return flask.jsonify(data)# 获取上传的图像文件file = flask.request.files['image']# 检查文件名是否为空if file.filename == '':data['message'] = '空文件名'return flask.jsonify(data)# 检查文件类型是否允许if not allowed_file(file.filename):data['message'] = '不支持的文件类型'return flask.jsonify(data)# 读取图像文件内容image_data = file.read()# 打开图像文件image = Image.open(io.BytesIO(image_data))# 对图像进行预处理image = prepare_image(image, target_size=(224, 224))# 在推理过程中关闭梯度计算,减少内存消耗with torch.no_grad():# 对图像进行预测并应用softmax函数得到概率分布preds = F.softmax(model(image), dim=1)# 获取概率最高的前3个结果results = torch.topk(preds.cpu(), k=3, dim=1)# 获取概率和标签probabilities, labels = results.values.numpy()[0], results.indices.numpy()[0]# 构建预测结果列表data['predictions'] = [{'label': str(label), 'probability': float(prob)}for prob, label in zip(probabilities, labels)]# 标记预测成功data['success'] = Truereturn flask.jsonify(data)except Exception as e:# 若处理请求过程中出现异常,记录错误信息并返回错误响应data['message'] = f'处理请求时出错: {str(e)}'return flask.jsonify(data), 500def allowed_file(filename):"""检查文件类型是否允许:param filename: 文件名:return: 是否允许的布尔值"""# 定义允许的文件扩展名allowed_extensions = {'png', 'jpg', 'jpeg', 'gif'}# 检查文件名是否包含扩展名且扩展名是否在允许列表中return '.' in filename and \filename.rsplit('.', 1)[1].lower() in allowed_extensionsif __name__ == '__main__':# 打印启动信息print("正在加载PyTorch模型并启动Flask服务器...")try:# 加载模型load_model()# 启动Flask服务器,监听指定端口,使用多线程处理请求app.run(port=5012, threaded=True)except Exception as e:# 若服务器启动过程中出现异常,打印错误信息print(f"服务器启动失败: {str(e)}")

测试本地模型(客户端):

import requests# 定义Flask服务器的预测接口URL
flask_url = 'http://127.0.0.1:5012/predict'def predict_result(image_path):"""该函数用于向Flask服务器发送图像并获取预测结果:param image_path: 待预测图像的文件路径"""# 以二进制模式打开图像文件并读取其内容image = open(image_path, 'rb').read()# 构建请求的负载,将图像数据作为名为 'image' 的文件上传payload = {'image': image}# 向Flask服务器的预测接口发送POST请求,并将响应解析为JSON格式r = requests.post(flask_url, files=payload).json()# 检查请求是否成功if r['success']:# 遍历预测结果列表for (i, result) in enumerate(r['predictions']):# 打印每个预测结果的排名、预测类别和对应的概率print('{}.预测类别为{}:的概率:{}'.format(i + 1, result['label'], result['probability']))else:# 若请求失败,打印失败信息print('Request failed')if __name__ == '__main__':# 调用预测函数,传入待预测图像的文件路径predict_result('./flower_data/val_filelist/image_00059.jpg')

结果:
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/37759.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

解码小米714亿资本棋局:雷军“押宝”AI新战场

目录 小米的AI战略:70亿投入背后的逻辑 1. ​AI成为核心战略,聚焦三大方向 2. ​资本开支超100亿,投资AI基础层公司 3. ​自研芯片与大模型突破 小米的资本棋局:从智能硬件到AI生态 1. ​714亿投资布局,构建产业…

如何为在线游戏选择合适的游戏盾?

在当今这个互联网高速发展的时代,在线游戏已经成为许多人日常生活中不可或缺的一部分。然而,随着游戏人数的不断增加,网络安全问题也层出不穷。游戏盾的问世便是为了解决这一系列安全隐患,确保玩家在游戏中能够拥有安全、畅快的体…

自适应柔顺性策略:扩散引导控制中学习近似的柔顺

24年10月来自斯坦福大学和 TRI 的论文“Adaptive Compliance Policy: Learning Approximate Compliance for Diffusion Guided Control”。 柔顺性在操作中起着至关重要的作用,因为它可以在不确定的情况下平衡位置和力的并发控制。然而,当今的视觉运动策…

w264民族婚纱预定系统

🙊作者简介:多年一线开发工作经验,原创团队,分享技术代码帮助学生学习,独立完成自己的网站项目。 代码可以查看文章末尾⬇️联系方式获取,记得注明来意哦~🌹赠送计算机毕业设计600个选题excel文…

栈/堆/static/虚表

在 C 里&#xff0c;栈空间主要用来存放局部变量、函数调用信息等。下面为你介绍栈空间在 C 里的运用方式。 1. 局部变量的使用 在函数内部定义的变量会被存于栈空间&#xff0c;当函数执行结束&#xff0c;这些变量会自动被销毁。 #include <iostream>void exampleFu…

SpringBoot实现异步调用的方法

在Java中使用Spring Boot实现异步请求和异步调用是一个常见的需求&#xff0c;可以提高应用程序的性能和响应能力。以下是实现这两种异步操作的基本方法&#xff1a; 一、异步请求&#xff08;Asynchronous Request&#xff09; 异步请求允许客户端发送请求后立即返回&#x…

基于 Prompt 的实体关系抽取:原理与优势解析

一、信息抽取的现状与挑战 在当今数字化时代&#xff0c;信息抽取作为自然语言处理&#xff08;NLP&#xff09;领域的核心技术&#xff0c;具有不可替代的重要性。从海量的非结构化文本数据中精准提取出有价值的信息&#xff0c;例如实体&#xff08;如人名、组织名&#xff…

SolidWorks使用显卡教程

操作步骤&#xff1a; 打开注册表编辑器 按下键盘上的 Win R 组合键&#xff0c;输入 regedit 并按回车键&#xff0c;打开注册表编辑器。 导航到显卡信息路径 在注册表中依次展开以下路径&#xff1a; plaintext HKEY_CURRENT_USER\Software\SolidWorks\SOLIDWORKS 2021\Per…

spring-tx笔记

编程式事务与声明式事务的理解 补充&#xff1a;什么是事务&#xff1f; 事务是一个重要概念&#xff0c;尤其在数据库管理系统中。事务是指一组操作。&#xff0c;这些操作要么全部成功执行&#xff0c;要么全部不执行&#xff0c;确保数据的一致性和完整性 编程式事务 编…

使用excel.EasyExcel实现导出有自定义样式模板的excel数据文件,粘贴即用!!!

客户要求导出的excel文件是有好看格式的&#xff0c;当然本文举例模板文件比较简单&#xff0c;内容丰富的模板可以自行设置&#xff0c;话不多说&#xff0c;第一步设置一个"好看"的excel文件模板 上面要注意的地方是{.变量名} &#xff0c;这里的变量名对应的就是…

AutoGluon快速上手

我叫不三不四&#xff0c;很高兴见到大家&#xff0c;欢迎一起学习交流和进步 今天来讲一讲机器学习包 AutoGluon简介&#xff1a; AutoGluon 提供了多种模型来处理不同类型的数据和任务&#xff0c;是由 亚马逊 AWS 团队 开发的一款开源 AutoML 框架&#xff0c;旨在简化机器…

AI风向标《AI与视频制作全攻略:从入门到精通实战课程》

课程信息 AI风向标《AI与视频制作全攻略&#xff1a;从入门到精通实战课程》,夸克网盘和百度网盘课程。 课程介绍 《AI与视频制作全攻略&#xff1a;从入门到精通实战课程》是一套全面融合AI技术与视频制作的实战课程&#xff0c;旨在帮助创作者从基础软件使用到高级视频剪辑…

Docker学习笔记(十)搭建Docker私有仓库

一、环境配置 1、宿主机系统&#xff1a;macOS Sequoia(版本15.2) 2、虚拟机VMware Fusion版本&#xff1a;专业版 13.6.2 (24409261) 3、虚拟机系统&#xff1a;AlmaLinux-9-latest-x86_64-boot.iso 二、安装Harbor开源企业级Docker镜像 Harbor 是一个开源的企业级 Docker…

Linux中基本命令

目录 ls pwd cd touch mkdir rm cp mv cat less head tail find grep ls 其实大部分命令都是可执行的文件&#xff0c;但有一些命令比如Shell内置命令&#xff0c;它没有对应的独立可执行文件&#xff0c;而是由Shell直接解释执行的。 功能&#xff1a;显示当前目…

IDEA导入jar包后提示无法解析jar包中的类,比如无法解析符号 ‘log4j‘

IDEA导入jar包后提示无法解析jar包中的类 问题描述解决方法 问题描述 IDEA导入jar包的Maven坐标后&#xff0c;使用jar中的类比如log4j&#xff0c;仍然提示比如无法解析符号 log4j。 解决方法 在添加了依赖和配置文件后&#xff0c;确保刷新你的IDE项目和任何缓存&#xff…

字节跳动实习生主导开发强化学习算法,助力大语言模型性能突破

目录 禹棋赢的背景与成就 主要成就 DAPO算法的技术细节 算法优势 禹棋赢的研究历程 关键时间节点 字节跳动的“Top Seed人才计划” 计划特点 小编总结 在大模型时代&#xff0c;经验不再是唯一的衡量标准&#xff0c;好奇心、执行力和对新技术的敏锐洞察力成为推动技术…

Mysql表的简单操作

&#x1f3dd;️专栏&#xff1a;Mysql_猫咪-9527的博客-CSDN博客 &#x1f305;主页&#xff1a;猫咪-9527-CSDN博客 “欲穷千里目&#xff0c;更上一层楼。会当凌绝顶&#xff0c;一览众山小。” 目录 3.1 创建表 3.2 查看表结构 3.3 修改表 1. 添加字段 2. 修改字段 …

【一起学Rust | Tauri2.0框架】基于 Rust 与 Tauri 2.0 框架实现全局状态管理

前言 在现代应用程序开发中&#xff0c;状态管理是构建复杂且可维护应用的关键。随着应用程序规模的增长&#xff0c;组件之间共享和同步状态变得越来越具有挑战性。如果处理不当&#xff0c;状态管理可能会导致代码混乱、难以调试&#xff0c;并最终影响应用程序的性能和可扩…

大模型的微调技术(高效微调原理篇)

背景 公司有需求做农业方向的大模型应用以及Agent助手&#xff0c;那么适配农业数据就非常重要。但众所周知&#xff0c;大模型的全量微调对算力资源要求巨大&#xff0c;在现实的限制条件下基本“玩不起”&#xff0c;那么高效微调技术就非常必要。为了更好地对微调技术选型和…

Java 大视界 -- Java 大数据在智能家居设备联动与场景自动化中的应用(140)

&#x1f496;亲爱的朋友们&#xff0c;热烈欢迎来到 青云交的博客&#xff01;能与诸位在此相逢&#xff0c;我倍感荣幸。在这飞速更迭的时代&#xff0c;我们都渴望一方心灵净土&#xff0c;而 我的博客 正是这样温暖的所在。这里为你呈上趣味与实用兼具的知识&#xff0c;也…