在一小时内构建您的深度学习应用程序

一、说明

        我已经做了将近十年的数据分析。有时,我使用机器学习技术从数据中获取见解,并且我习惯于使用经典 ML。

        虽然我已经通过了神经网络和深度学习的一些MOOC,但我从未在我的工作中使用过它们,这个领域对我来说似乎很有挑战性。我有所有这些偏见:

  • 你需要学习很多东西才能开始使用深度学习:数学,不同的框架(我至少听说过其中的三个:和)和网络的架构。PyTorchTensorFlowKeras
  • 需要庞大的数据集来拟合模型。
  • 如果没有强大的计算机(它们还必须具有Nvidia GPU),就不可能获得像样的结果,因此很难进行设置。
  • 启动并运行 ML 驱动的服务有很多样板文件:您需要处理前端和后端端。

        我相信分析的主要目标是帮助产品团队根据数据做出正确的决策。如今,神经网络绝对可以改善我们的分析,即NLP有助于从文本中获得更多见解。因此,我决定再次尝试利用深度学习的力量对我有帮助。

        这就是我开始 Fast.AI 课程的方式(它在 2022 年初更新,所以我想自之前对 TDS 的评论以来,内容已经发生了变化)。我已经意识到使用深度学习解决你的任务并不是那么困难。

        本课程遵循自上而下的方法。因此,您从构建一个工作系统开始,然后才能更深入地了解所有必需的基础知识和细微差别。

        我在第二周制作了我的第一个 ML 驱动的应用程序(你可以在这里尝试)。 这是一个图像分类模型,可以识别我最喜欢的狗品种。令人惊讶的是,即使我的数据集中只有几千张图像,它也能很好地工作。这让我感到鼓舞,我们现在可以轻松构建一项十年前完全神奇的服务。

        因此,在本文中,您将找到有关构建和部署由机器学习提供支持的第一个服务的初学者级教程。

二、什么是深度学习?

        当我们使用多层神经网络作为模型时,深度学习是机器学习的一个特定用例。

        神经网络非常强大。根据通用近似定理,神经网络可以近似任何函数,这意味着它们能够解决任何任务。

        现在,您可以将此模型视为一个黑盒,它接受输入(在我们的例子中 - 一个狗图像)并返回输出(在我们的例子中 - 一个标签)。

作者摄

三、构建模型

您可以在Kaggle上找到此阶段的完整代码。

        我们将使用Kaggle笔记本来构建我们的深度学习模型。如果您还没有在 Kaggle 上拥有帐户,那么值得通过注册过程。Kaggle是数据科学家的流行平台,您可以在其中查找数据集,参加竞赛以及运行和共享代码。

        您可以在 Kaggle 上创建一个笔记本,并在此处执行代码,就像在本地 Jupyter 笔记本中一样。Kaggle甚至提供了GPU,因此我们将能够非常快速地训练NN模型。

图片来源:作者

让我们从导入所有包开始,因为我们将使用许多 Fast.AI 工具。

from fastcore.all import *
from fastai.vision.all import *
from fastai.vision.widgets import *
from fastdownload import download_url

四、加载数据

        不言而喻,我们需要一个数据集来训练我们的模型。获取一组图像的最简单方法是使用搜索引擎。

DuckDuckGo搜索引擎有一个易于使用的API和方便的Python包(更多信息),所以我们将使用它。duckduckgo_search

        让我们尝试搜索狗的图像。我们已指定仅使用具有知识共享许可的图像。license_image = any

from duckduckgo_search import DDGS
import itertools
with DDGS() as ddgs:res = list(itertools.islice(ddgs.images('photo samoyed happy', license_image = 'any'), 1))

        在输出中,我们获得了有关图像的所有信息:名称,URL和大小。

{"title": "Happy Samoyed dog photo and wallpaper. Beautiful Happy Samoyed dog picture", "image": "http://www.dogwallpapers.net/wallpapers/happy-samoyed-dog-wallpaper.jpg", "thumbnail": "https://tse2.mm.bing.net/th?id=OIP.BqTE8dYqO-W9qcCXdGcF6QHaFL&pid=Api", "url": "http://www.dogwallpapers.net/samoyed-dog/happy-samoyed-dog-wallpaper.html", "height": 834, "width": 1193, "source": "Bing"
}

        现在我们可以使用 Fast.AI 工具下载图像并显示缩略图。

摄影:Barcs Tamás on Unsplash

        我们看到一个快乐的萨摩耶德,这意味着它正在工作。因此,让我们加载更多照片。

        我的目标是确定五种不同的狗品种(我最喜欢的品种)。我将为每个品种加载图片并将它们存储在单独的目录中。

breeds = ['siberian husky', 'corgi', 'pomeranian', 'retriever', 'samoyed']
path = Path('dogs_breeds') # defining pathfor b in tqdm.tqdm(breeds):dest = (path/b)dest.mkdir(exist_ok=True, parents=True) download_images(dest, urls=search_images(f'photo {b}'))sleep(10) download_images(dest, urls=search_images(f'photo {b} puppy'))sleep(10) download_images(dest, urls=search_images(f'photo {b} sleep'))sleep(10) resize_images(path/b, max_size=400, dest=path/b)

运行此代码后,您将在Kaggle的右侧面板上看到所有加载的照片。

图片来源:作者

        下一步是将数据转换为适合 Fast.AI 模型的格式 — 。DataBlock

        您需要为此对象指定一些参数,但我将只强调最重要的参数:

  • splitter=RandomSplitter(valid_pct=0.2, seed=18):Fast.AI 要求您选择一个验证集。验证集是将用于估计模型质量的保留数据。训练期间不会使用验证数据来防止过度拟合。在我们的例子中,验证集是数据集的随机 20%。我们指定了参数,以便下次能够重现完全相同的拆分。seed
  • item_tfms=[Resize(256, method=’squish’)]:神经网络批量处理图像。这就是为什么我们必须拥有相同大小的图片。图像大小调整有不同的方法,我们现在使用 squish,但我们稍后会更详细地讨论它。

        我们已经定义了一个数据块。该函数可以向我们显示一组带有标签的随机图像。show_batch

摄影:Angel Luciano on Unsplash |摄影:Brigitta Botrágyi on Unsplash |摄影:Charlotte Freeman on Unsplash

数据看起来不错,所以让我们继续训练。

五、训练模型

您可能会感到惊讶,但下面的两行代码将完成所有工作。

        我们使用了预训练模型(具有 18 个深层的卷积神经网络 — )。这就是为什么我们称该函数。Resnet18fine_tune

        我们对模型进行了三个时期的训练,这意味着模型看到了整个数据集 3 次。

        我们还指定了指标 — (正确标记的图片的份额)。您可以在每个纪元后的结果中看到此指标(仅使用验证集计算,以免扭曲结果)。但是,它不会在优化过程中使用,仅供您参考。accuracy

        整个过程大约需要 30 分钟,现在我们的模型可以预测狗的品种,准确率为 94.45%。干得好!但是我们能改善这个结果吗?

六、改进模型:数据清理和扩充

如果希望看到第一个模型尽快工作,请随时将本部分留到以后,并转到模型的部署。

        首先,让我们看看模型的错误:它是否无法区分柯基犬和哈士奇犬或博美犬和猎犬。我们可以使用它。请注意,混淆矩阵也仅使用验证集进行计算。confusion_matrix

        Fast.AI 课程中分享的另一个生活技巧是可以使用模型来清理我们的数据。对于它,我们可以看到损失最高的图像:可能是模型错误但置信度高或正确但置信度低的情况。

摄影:Benjamin Vang在Unsplash |摄影:Xennie Moore on Unsplash |摄影:Alvan Nee on Unsplash

        显然,第一张图片的标签不正确,而第二张图片同时包含哈士奇和柯基。所以有一些改进的余地。

        幸运的是,Fast.AI 提供了一个方便的小部件,可以帮助我们快速解决数据问题。可以在笔记本中对其进行初始化,然后可以更改数据集中的标签。ImageClassifierCleaner

cleaner = ImageClassifierCleaner(learn)
cleaner 

        在每个类别之后,您可以运行以下代码来解决问题:删除图像或将其移动到正确的文件夹。

for idx in cleaner.delete(): cleaner.fns[idx].unlink()
for idx,breed in cleaner.change(): shutil.move(str(cleaner.fns[idx]), path/breed)

现在我们可以再次训练我们的模型,并看到准确率有所提高:95.4% vs 94.5%。

正确识别的柯基犬的比例从88%增加到96%。明!

        改进模型的另一种方法是更改调整大小的方法。我们使用了挤压方法,但如您所见,它可以改变自然物体的比例。让我们尝试更具想象力并使用增强功能。

        增强是对图像的更改(例如,对比度改进、旋转或裁剪)。它将为我们的模型提供更多可变数据,并有望提高其质量。

        与 Fast.AI 一样,您只需更改几个参数即可添加增强功能。

照片由FLOUFFY在Unsplash上拍摄

        此外,由于使用增强模型在每个时期都会看到略有不同的图片,因此我们可以增加时期的数量。经过六个时期,我们达到了 95.65% 的准确率——结果要好一些。整个过程花了大约一个小时。

七、下载模型

        最后一步是下载我们的模型。这很简单。

learn.export('cuttest_dogs_model.pkl')

        然后,您将保存一个标准文件(用于存储对象的常见Python格式)。只需选择Kaggle笔记本右侧面板中的文件旁边,您就可以在计算机上获得模型。pickleMore actions

现在我们有了经过训练的模型,让我们部署它,以便您可以与世界共享结果。

八、部署模型

我们将使用HuggingFace Spaces和Gradio来构建我们的Web应用程序。

8.1 设置HuggingFace空间

        HuggingFace是一家为机器学习提供便捷工具的公司,例如,流行的转换器库或共享模型和数据集的工具。今天,我们将使用他们的空间来托管我们的应用程序。

        首先,如果您尚未注册,则需要创建一个帐户。只需几分钟。点击此链接。

        现在是时候创建一个新的空间了。前往“空间”选项卡,然后按“创建”按钮。您可以在文档中找到包含更多详细信息的说明。

        然后,您需要指定以下参数:

  • 名称(它将用于您的应用程序URL,因此请明智地选择),
  • 许可证(我选择了开源 Apache 2.0 许可证)
  • SDK(在本例中我将使用 Gradio)。

        Then user-friendly HuggingFace shows you instructions. TL;DR now you have a Git repository, and you need to commit your code there.

        Git 有一个细微差别。由于您的模型可能非常大,因此最好设置 Git LFS(大文件存储),然后 Git 不会跟踪此文件的所有更改。要进行安装,请按照站点上的说明进行操作。

-- cloning repo
git clone https://huggingface.co/spaces/<your_login>/<your_app_name>
cd <your_app_name>-- setting up git-lfs
git lfs install
git lfs track "*.pkl"
git add .gitattributes
git commit -m "update gitattributes to use lfs for pkl files"

8.2  Gradio 

          Gradio是一个框架,允许你只使用Python构建愉快和友好的Web应用程序。这就是为什么它是原型设计的宝贵工具(特别是对于像我这样没有深厚JavaScript知识的人来说)。

        在 Gradio 中,我们将定义我们的接口,指定以下参数:

  • 输入 — 图像,
  • 输出 — 具有五个可能类的标签,
  • 标题描述一组示例图像(我们还必须将它们提交到 repo),
  • enable_queue=True将帮助应用程序处理大量流量,如果它变得非常流行,
  • 要为输入图像执行的函数

        为了获取输入图像的标签,我们需要定义一个预测函数,该函数加载我们的模型并返回一个字典,其中包含每个类的概率。

        最后,我们将有以下代码app.py

import gradio as gr
from fastai.vision.all import *learn = load_learner('cuttest_dogs_model.pkl')labels = learn.dls.vocab # list of model classes
def predict(img):img = PILImage.create(img)pred,pred_idx,probs = learn.predict(img)return {labels[i]: float(probs[i]) for i in range(len(labels))}gr.Interface(fn=predict,inputs=gr.inputs.Image(shape=(512, 512)),outputs=gr.outputs.Label(num_top_classes=5),title="The Cuttest Dogs Classifier 🐶🐕🦮🐕‍🦺",description="Classifier trainded on images of huskies, retrievers, pomeranians, corgis and samoyeds. Created as a demo for Deep Learning app using HuggingFace Spaces & Gradio.",examples=['husky.jpg', 'retriever.jpg', 'corgi.jpg', 'pomeranian.jpg', 'samoyed.jpg'],enable_queue=True).launch()

        如果您想了解有关 Gradio 的更多信息,请阅读文档。

        让我们也创建文件,然后这个库将安装在我们的服务器上。requirements.txtfastai

        所以剩下的唯一一点就是将所有内容推送到 HuggingFace Git 存储库。

git add * 
git commit -am 'First version of Cuttest Dogs app'
git push

您可以在 GitHub 上找到完整的代码。

        推送文件后,返回 HuggingFace 空间,你会看到一张类似的图片,展示了构建过程。如果一切正常,您的应用将在几分钟内运行。

如果有任何问题,您将看到堆栈跟踪。然后,您将不得不返回到代码,修复错误,推送新版本,然后再等待几分钟。

8.3 开始启动

        现在我们可以使用这个模型和真实照片来验证我家的狗实际上是柯基犬。

九 后记

        今天,我们已经完成了构建深度学习应用程序的整个过程:从获取数据集和拟合模型到编写和部署 Web 应用程序。希望您能够完成本教程,现在您正在生产中测试您的出色模型。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/93400.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

理解持续测试,才算理解DevOps

软件产品的成功与否&#xff0c;在很大程度上取决于对市场需求的及时把控&#xff0c;采用DevOps可以加快产品交付速度&#xff0c;改善用户体验&#xff0c;从而有助于保持领先于竞争对手的优势。 作为敏捷开发方法论的一种扩展&#xff0c;DevOps强调开发、测试和运维不同团…

青翼科技自研2路250MSPS DA回放FMC子卡模块

FMC150_V30是一款基于VITA57.1规范的2路125MSPS采样率16位分辨率AD采集、2路250MSPS采样率16位分辨率DA回放FMC子卡模块。该模块遵循VITA57.1规范&#xff0c;可直接与符合VITA57.1规范的FPGA载卡配合使用&#xff0c;板卡ADC器件采用ADI公司的AD9268芯片&#xff0c;板卡DAC器…

React Native expo项目修改应用程序名称

https://expo.dev/accounts/xutongbao/projects npm install --global eas-cli && \eas init --id e32cf2c0-da5b-4a65-814a-4958d58f0ca7 eas init --id e32cf2c0-da5b-4a65-814a-4958d58f0ca7 app.config.js: export default {name: 学习,slug: learn-gpt,owner: x…

【C++】list容器

1.list基本概念 2.list构造函数 #include <iostream> using namespace std;#include<list> //链表list容器构造函数//输出list链表 void printList(const list<int>& L) {for (list<int>::const_iterator it L.begin(); it ! L.end(); it){cout &…

深度学习1:通过模型评价指标优化训练

P(Positive)表示预测为正样本&#xff0c;N(negative)表示预测为负样本&#xff0c;T(True)表示预测正确,F(False)表示预测错误。 TP&#xff1a;正样本预测正确的数量&#xff08;正确检测&#xff09; FP&#xff1a;负样本预测正确数量&#xff08;误检测&#xff09; TN…

小米有品众筹,小米上新3D打印机!米家3D打印机购买前必看的注意事项!

小米推出3D打印机&#xff0c;米家3D打印机购买前必看 3D打印机在人们的生活中发挥着巨大的作用&#xff0c;无论是在科研实验室还是家庭工作室&#xff0c;它们正以惊人的速度改变着我们的世界。最近&#xff0c;科技巨头小米也加入了这一领域&#xff0c;推出了一款全新的&q…

IT运维:使用数据分析平台监控深信服防火墙

概述 深信服防火墙自身监控可以满足绝大部分需求&#xff0c;比如哪个应用占了最大带宽&#xff0c;哪个用户访问了哪些网站&#xff1f;这里我们为什么使用鸿鹄呢&#xff1f;因为我们要的是数据的处理和分析&#xff0c;比如某个用户在某个事件都做了哪些行为&#xff0c;这个…

【人工智能124种任务大集合】-集齐了自然语言处理(NLP),计算机视觉(CV),语音识别,多模态等任务

大家好&#xff0c;我是微学AI&#xff0c;今天给大家介绍一下人工智能124种任务大集合&#xff0c;任务集合主要包括4大类&#xff1a;自然语言处理&#xff08;NLP&#xff09;、计算机视觉&#xff08;CV&#xff09;、语音识别、多模态任务。 我这里整理了124种应用场景任…

云安全攻防(十二)之 手动搭建 K8S 环境搭建

手动搭建 K8S 环境搭建 首先前期我们准备好三台 Centos7 机器&#xff0c;配置如下&#xff1a; 主机名IP系统版本k8s-master192.168.41.141Centos7k8s-node1192.168.41.142Centos7k8s-node2192.168.41.143Centos7 前期准备 首先在三台机器上都执行如下的命令 # 关闭防火墙…

【笔试题心得】物理内存和虚拟内存的区别和联系

物理内存和虚拟内存指的是什么——区别 物理内存&#xff1a; 定义&#xff1a; 物理内存是计算机实际存在的硬件内存&#xff0c;是CPU和其他硬件设备可以直接访问的存储空间。大小限制&#xff1a; 物理内存的大小是有限的&#xff0c;取决于计算机硬件的配置&#xff0c;通…

R-Meta分析与【文献计量分析、贝叶斯、机器学习等】多技术融合

Meta分析是针对某一科研问题&#xff0c;根据明确的搜索策略、选择筛选文献标准、采用严格的评价方法&#xff0c;对来源不同的研究成果进行收集、合并及定量统计分析的方法&#xff0c;最早出现于“循证医学”&#xff0c;现已广泛应用于农林生态&#xff0c;资源环境等方面。…

导读-Linux简介

Linux简介 ​ 总所周知&#xff0c;计算机系统包含硬件和软件两部分。硬件部分被称为裸机&#xff0c;主要包括中央处理器&#xff08;CPU&#xff09;、内存、外存和各种外部设备。软件部分主要包括系统软件和应用软件两部分。系统软件包括操作系统、汇编语言、编译程序、数据…

docker compose部署zookeeper

单机部署 新建docker-compose.yaml version: 3 services:zookeeper:image: zookeeper:3.5.7container_name: base-zookeeperhostname: zookeeperprivileged: truerestart: alwaysports:- 2181:2181environment:TZ: "Asia/Shanghai"volumes:- ./volumes/zookeeper/d…

蓝牙资讯|2023年Q2蓝牙耳机市场报告发布,苹果依然占据第一

市场调查机构 Canalys 发布最新报告&#xff0c;2023 年第二季度全球个人智能音频设备&#xff08;包括 TWS, 无线头戴&#xff0c;无线颈挂&#xff09;下滑了 2%&#xff0c;出货量达到 9568 万部&#xff0c;基本追平去年同期。其中&#xff0c;真无线耳机&#xff08;TWS&a…

Java语言怎么输出有颜色的字符串呢?

在Java中&#xff0c;我们应该如何输出有颜色的文字字符串呢&#xff1f; 目录 一、使用方法 二、举例说明 三、常见的颜色及其对应的ANSI转义序列 一、使用方法 在Java中&#xff0c;可以使用ANSI转义序列来改变输出文本的颜色。 二、举例说明 &#xff08;1&#xff…

Android UI自动化测试框架—SoloPi简介

1、UI自动化测试简介 软件测试简介 ​软件测试是伴随着软件开发一同诞生的&#xff0c;随着软件规模大型化&#xff0c;结构复杂化&#xff0c;软件测试也从最初的简单“调试”&#xff0c;发展到当今的自动化测试。 ​ 自动化测试是什么呢&#xff1f;自动化测试是把以人为…

Docker部署rabbitmq遇到的问题 Stats in management UI are disabled on this node

1. Stats in management UI are disabled on this node #进入rabbitmq容器 docker exec -it {rabbitmq容器名称或者id} /bin/bash#进入容器后&#xff0c;cd到以下路径 cd /etc/rabbitmq/conf.d/#修改 management_agent.disable_metrics_collector false echo management_age…

【iMessage苹果推?IM推送】群控脚本当Apple APNS推送服务器从您的应用程序接吸收注册消息时,它将为您回到一串devicetoken

推荐内容IMESSGAE相关 作者✈️IMEAE推荐内容iMessage苹果推软件 *** 点击即可查看作者要求内容信息作者✈️IMEAE推荐内容1.家庭推内容 *** 点击即可查看作者要求内容信息作者✈️IMEAE推荐内容2.相册推 *** 点击即可查看作者要求内容信息作者✈️IMEAE推荐内容3.日历推 *** …

设计模式之享元模式(Flyweight)的C++代码实现

1、享元模式提出 面向对象很好地解决了抽象问题&#xff0c;但是创建对象会带来一定的内存开销。绝大部分情况下&#xff0c;创建对象带来的内存开销是可以忽略不计的&#xff1b;在有些情况下是需要谨慎处理的&#xff0c;如类A的sizeof是50个字节&#xff0c;则创建50*1024*…

CSS实现左侧固定,右侧自适应(5种方法)

<div class"father"><!-- 左右div不能调换顺序来写 --><div class"left">固定宽度区</div><div class"right">自适应区</div> </div> 一、利用左侧浮动float右侧margin-left /* 利用浮动floatmargin…