Azure 机器学习 - 无代码自动机器学习的预测需求

了解如何在 Azure 机器学习工作室中使用自动化机器学习在不编写任何代码行的情况下创建时序预测模型。 此模型将预测自行车共享服务的租赁需求。

关注TechLead,分享AI全维度知识。作者拥有10+年互联网服务架构、AI产品研发经验、团队管理经验,同济本复旦硕,复旦机器人智能实验室成员,阿里云认证的资深架构师,项目管理专业人士,上亿营收AI产品研发负责人。

file

一、环境准备

  • Azure 机器学习工作区。 请参阅创建工作区资源。

  • 下载 bike-no.csv 数据文件

二、登录到工作室

本教程将在 Azure 机器学习工作室中创建自动化 ML 试验运行。机器学习工作室是一个整合的 Web 界面,其中包含的机器学习工具可让各种技能水平的数据科学实践者执行数据科学方案。 Internet Explorer 浏览器不支持此工作室。

  1. 登录到 Azure 机器学习工作室。

  2. 选择创建的订阅和工作区。

  3. 选择“开始”。

  4. 在左窗格的“创作”部分,选择“自动化 ML” 。

  5. 选择“+新建自动化 ML 作业”。

三、创建并加载数据集

在配置试验之前,请以 Azure 机器学习数据集的形式将数据文件上传到工作区。 这可以确保数据格式适合在试验中使用。

  1. 在“选择数据集”窗体中,从“+ 创建数据集”下拉列表中选择“从本地文件”。

    1. 在“基本信息”窗体中,为数据集指定名称,并提供可选的说明。 数据集类型默认为“表格”,因为 Azure 机器学习工作室中的自动化 ML 目前仅支持表格数据集。

    2. 在左下角选择“下一步”

    3. 在“数据存储和文件选择”窗体中,选择在创建工作区期间自动设置的默认数据存储“workspaceblobstore (Azure Blob 存储)”。 这是要将数据文件上传到的存储位置。

    4. 在“上传”下拉菜单中,选择“上传文件”。

    5. 在本地计算机上选择“bike-no.csv”文件。 这是作为必备组件下载的文件。

    6. 选择“下一步”

      上传完成后,系统会根据文件类型预先填充“设置和预览”窗体。

    7. 验证“设置和预览”窗体是否已填充如下,然后选择“下一步”。

      字段说明教程的值
      文件格式定义文件中存储的数据的布局和类型。带分隔符
      分隔符一个或多个字符,用于指定纯文本或其他数据流中不同的独立区域之间的边界。逗号
      编码指定字符架构表中用于读取数据集的位。UTF-8
      列标题指示如何处理数据集的标头(如果有)。仅第一个文件包含标头
      跳过行指示要跳过数据集中的多少行(如果有)。
    8. 通过“架构”窗体,可以进一步为此试验配置数据。

      1. 对于本示例,请选择忽略 casualregistered 列。 这些列是 cnt 列的细目,因此我们不会包含这些列。

      2. 此外,对于本示例,请保留“属性”和“类型”的默认值。

      3. 选择“下一页”。

    9. 在“确认详细信息”窗体上,确认信息与先前在“基本信息”和“设置和预览”窗体上填充的内容匹配。

    10. 选择“创建”以完成数据集的创建。

    11. 当数据集出现在列表中时,则选择它。

    12. 选择“下一页”。


四、配置作业

加载并配置数据后,请设置远程计算目标,并在数据中选择要预测的列。

  1. 按如下所述填充“配置作业”窗体:
    1. 输入试验名称:automl-bikeshare

    2. 选择“cnt”作为要预测的目标列。 此列指示共享单车的租赁总次数。

    3. 选择“计算群集”作为计算类型。

    4. 选择“+ 新建”以配置计算目标。 自动 ML 仅支持 Azure 机器学习计算。

      1. 填充“选择虚拟机”窗体以设置计算。

        字段说明教程的值
        虚拟机层选择试验应具有的优先级专用
        虚拟机类型选择计算的虚拟机大小。CPU(中央处理单元)
        虚拟机大小指定计算资源的虚拟机大小。 根据数据和试验类型提供了建议的大小列表。Standard_DS12_V2
      2. 选择“下一步”以填充“配置设置窗体”。

        字段说明教程的值
        计算名称用于标识计算上下文的唯一名称。bike-compute
        最小/最大节点数若要分析数据,必须指定一个或多个节点。最小节点数:1
        最大节点数:6
        缩减前的空闲秒数群集自动缩减到最小节点数之前的空闲时间。120(默认值)
        高级设置用于为试验配置虚拟网络并对其进行授权的设置。
      3. 选择“创建”,获取计算目标。

        完成此操作需要数分钟的时间。

      4. 创建后,从下拉列表中选择新的计算目标。

    5. 选择“下一页”。


五、选择预测设置

通过指定机器学习任务类型和配置设置来完成自动化 ML 试验的设置。

  1. 在“任务类型和设置”窗体中,选择“时序预测”作为机器学习任务类型。

  2. 选择“日期”作为时间列,将“时序标识符”留空。

  3. “频率”是指收集历史数据的频率。 保留选择“自动检测”。

  4. “预测范围”是要预测的未来时间长短。 取消选择“自动检测”,并在字段中键入 14。

  5. 选择“查看其他配置设置”并按如下所示填充字段。 这些设置旨在更好地控制训练作业以及指定预测设置。 否则,将会根据试验选择和数据应用默认设置。

    其他配置说明教程的值
    主要指标对机器学习算法进行度量时依据的评估指标。规范化均方根误差
    解释最佳模型自动显示有关自动化 ML 创建的最佳模型的可解释性。启用
    阻止的算法要从训练作业中排除的算法极端随机树
    其他预测设置这些设置有助于提高模型的准确度。
    预测目标滞后:要将目标变量的滞后往后推多久
    目标滚动窗口:指定滚动窗口的大小(例如 max, minsum),将基于此大小生成特征。

    |

    预测目标延隔:无
    目标滚动窗口大小:无

    |
    | 退出条件 | 如果符合某个条件,则会停止训练作业。 | 训练作业时间(小时):3
    指标分数阈值:无 |
    | 并发 | 每次迭代执行的并行迭代的最大数目 | 最大并发迭代数:6 |

    选择“保存”。

  6. 选择“下一步” 。

  7. 在“[可选]验证和测试”窗体上,

    1. 选择“k-折交叉验证”作为“验证类型”。
    2. 选择“5”作为“交叉验证次数”。

六、运行试验

若要运行试验,请选择“完成”。 此时会打开“作业详细信息”屏幕,其顶部的作业编号旁边显示了“作业状态”。 此状态随着试验的进行而更新。 通知也会显示在工作室的右上角,以告知你试验的状态。

重要

准备试验作业时,准备需要 10-15 分钟。 运行以后,每个迭代还需要 2-3 分钟

在生产环境中,此过程需要一段时间,因此不妨干点其他的事。 在等待过程中,我们建议在“模型”选项卡上开始浏览已完成测试的算法。


七、浏览模型

导航到“模型”选项卡,以查看测试的算法(模型)。 默认情况下,这些模型在完成后按指标分数排序。 对于本教程,列表中首先显示评分最高的模型(评分根据所选的“规范化均方根误差”指标给出)。

在等待所有试验模型完成的时候,可以选择已完成模型的“算法名称”,以便浏览其性能详细信息。

以下示例进行导航,从作业创建的模型列表中选择模型。 然后,选择“概述”和“指标”选项卡,查看选定模型的属性、指标和性能图表。
file


八、部署模型

Azure 机器学习工作室中的自动化机器学习可以通过几个步骤将最佳模型部署为 Web 服务。 部署是模型的集成,因此它可以对新数据进行预测并识别潜在的机会领域。

在此试验中部署到 Web 服务后,单车共享公司即会获得一个迭代且可缩放的 Web 解决方案,可以预测共享单车的租赁需求。

作业完成后,选择屏幕顶部的“作业 1”导航回父作业页。

在“最佳模型摘要”部分中,根据“标准化均方根误差”指标,选择此试验背景下的最佳模型。

我们将部署此模型,但请注意,部署需要大约 20 分钟才能完成。 部署过程需要几个步骤,包括注册模型、生成资源和为 Web 服务配置资源。

  1. 选择该最佳模型,以打开特定于模型的页。

  2. 选择位于屏幕左上角的“部署”按钮。

  3. 按如下所示填充“部署模型”窗格:

    字段
    部署名称bikeshare-deploy
    部署说明单车共享需求部署
    计算类型选择“Azure 计算实例(ACI)”
    启用身份验证禁用。
    使用自定义部署资产禁用。 禁用此选项可以自动生成默认驱动程序文件(评分脚本)和环境文件。

    本示例使用“高级”菜单中提供的默认值。

  4. 选择“部署”。

    “作业”屏幕的顶部会以绿色字体显示一条成功消息,指出部署已成功启动。 可以在“部署状态”下的“模型摘要”窗格中找到部署进度。

部署成功后,即会获得一个正常运行的、可以生成预测结果的 Web 服务。

九、清理资源

部署文件比数据文件和试验文件更大,因此它们的存储成本也更大。 仅当你想要最大程度地降低帐户成本,或者想要保留工作区和试验文件时,才删除部署文件。 否则,如果你不打算使用任何文件,请删除整个资源组。

删除部署实例

若要保留资源组和工作区以便在其他教程和探索中使用,请仅从 Azure 机器学习工作室中删除部署实例。

  1. 转到 Azure 机器学习工作室。 导航到你的工作区,然后在“资产”窗格的左下角选择“终结点”。

  2. 选择要删除的部署,然后选择“删除”。

  3. 选择“继续”。

删除资源组

重要

已创建的资源可用作其他 Azure 机器学习教程和操作方法文章的先决条件。

如果你不打算使用已创建的任何资源,请删除它们,以免产生任何费用:

  1. 在 Azure 门户中,选择最左侧的“资源组” 。

  2. 从列表中选择你创建的资源组。

  3. 选择“删除资源组”。

file

  1. 输入资源组名称。 然后选择“删除”。

关注TechLead,分享AI全维度知识。作者拥有10+年互联网服务架构、AI产品研发经验、团队管理经验,同济本复旦硕,复旦机器人智能实验室成员,阿里云认证的资深架构师,项目管理专业人士,上亿营收AI产品研发负责人。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/180257.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

牛客项目(五)-使用kafka实现发送系统通知

kafka入门以及与spring整合 Message.java import java.util.Date;public class Message {private int id;private int fromId;private int toId;private String conversationId;private String content;private int status;private Date createTime;public int getId() {retur…

Marp: 将 Markdown 变为 PPT 式样的 VScode 插件

样例代码&#xff1a; --- marp: true size: 16:9 theme: default header: footer: --- <!-- _footer: Jia ming<br>Gansu University of Political Science and Law --> <!-- _backgroundColor: lightskyblue --> ## <!-- fit --> 笔记检验概述>…

pytorch 中 nn.Conv2d 解释

1. pytorch nn.Con2d 中填充模式 torch.nn.Conv2d(in_channels, out_channels, kernel_size, stride1, padding0, dilation1, groups1, biasTrue, padding_mode‘zeros’, deviceNone, dtypeNone) 1.1 padding 参数的含义 首先 &#xff0c;padd N, 代表的是 分别在 上下&…

鉴源实验室 | 自动驾驶传感器攻击研究

作者 | 付海涛 上海控安可信软件创新研究院汽车网络安全组 来源 | 鉴源实验室 社群 | 添加微信号“TICPShanghai”加入“上海控安51fusa安全社区” 01 自动驾驶汽车的脆弱性 自2015年以来&#xff0c;汽车的信息安全问题受到国内外的广泛关注。而随着汽车的智能化与网联化的…

上海物理、化学高考命题趋势及2024年上海物理、化学高考备考建议

在上海高考时&#xff0c;物理、化学虽然不像语文、英语和数学那样分数高&#xff0c;但是仍然很重要。那么&#xff0c;从这几年的上海物理、化学的高考题目来看&#xff0c;我们互发现什么命题趋势和考题特点呢&#xff1f;如何备考接下来的2024年高考物理和化学呢&#xff1…

Ubuntu下安装vscode,并解决终端打不开vscode的问题

Visual Studio Code安装 1&#xff0c;使用 apt 安装 Visual Studio Code 在官方的微软 Apt 源仓库中可用。按照下面的步骤进行即可&#xff1a; 以 sudo 用户身份运行下面的命令&#xff0c;更新软件包索引&#xff0c;并且安装依赖软件&#xff1a; sudo apt update sud…

uniapp 微信小程ios端键盘弹起后导致页面无法滚动

项目业务逻辑和出现的问题整理 新增页面 用户可以主动添加输入文本框 添加多了就会导致当前页面出现滚动条,这就导致ios端滚动页面的时候去点击输入框键盘抬起再关闭的时候去滚动页面发现页面滚动不了(偶尔出现),经过多次测试发现是键盘抬起的时候 主动向上滑动 100%出现这种问…

【Linux】进程的概念

文章目录 1. 基本概念2. 进程的描述3. 进程的一些基本操作3.1 查看进程3.2 结束进程3.3 通过系统调用获取进程标示符3.4 通过系统调用来创建子进程 4. 进程状态4.1 操作系统的进程状态4.2 Linux对于这些状态的处理方式 1. 基本概念 什么是进程&#xff1f; 在回答这个问题之前…

云安全—docker Deamon攻击面

0x00 前言 本篇文章主要是讲docker Deamon的原理以及docker Deamon攻击面相关的内容&#xff0c;属于抛砖引玉系列&#xff0c;如有不妥之处还请斧正。 0x01 docker Deamon 还是先来看一下docker Deamon的一些相关知识&#xff0c;依旧是采用问答的方式来进行。为了文章的整…

2023-11-04:用go语言,如果n = 1,打印 1*** 如果n = 2,打印 1*** 3*** 2*** 如果n = 3,打印

2023-11-04&#xff1a;用go语言&#xff0c;如果n 1&#xff0c;打印 1*** 如果n 2&#xff0c;打印 1***3*** 2*** 如果n 3&#xff0c;打印 1***3*** 2***4*** 5*** 6*** 如果n 4&#xff0c;打印 1***3*** 2***4*** 5*** 6***10** 9*** 8*** 7*** 输入…

Spring底层原理(六)

Spring底层原理(六) 本章内容 介绍AOP的实现方式、JDK代理的模拟实现与源码 AOP的实现方式 使用代理模式 jdk动态代理cglib动态代理 使用aspectj的编译器&#xff0c;该编译器会直接对字节码进行修改&#xff0c;可以实现静态方法增强 使用javaagent,在jvm option中指定-…

高匿IP有什么作用

在互联网的蓬勃发展中&#xff0c;IP地址作为网络通信的基础&#xff0c;一直扮演着举足轻重的角色。而在诸多IP地址中&#xff0c;高匿IP地址则是一种特殊类型&#xff0c;其作用和价值在某些特定场合下尤为突出。那么&#xff0c;高匿IP地址究竟有哪些用处呢&#xff1f; 首先…

[动态规划] (五) 路径问题: LeetCode 62.不同路径

[动态规划] (五) 路径问题: LeetCode 62.不同路径 文章目录 [动态规划] (五) 路径问题: LeetCode 62.不同路径题目解析解题思路状态表示状态转移方程初始化和填表返回值 代码实现总结 62. 不同路径 题目解析 (1) 机器人从左上角到右下角有多少方法 (2) 机器人只能向左或者向右…

掌握Maven和SpringBoot的灵活性:定制化lib目录和依赖范围

前言 在开发基于Maven和SpringBoot的项目时&#xff0c;我们经常会使用第三方库来满足需求。然而&#xff0c;有时候我们需要更灵活地控制这些库的依赖范围和加载方式。本文将介绍如何使用Maven和SpringBoot实现定制化的lib目录和依赖范围。经过如下定制化后&#xff0c;打包执…

[PyTorch][chapter 61][强化学习-免模型学习1]

前言&#xff1a; 在现实的学习任务中&#xff0c;环境 其中的转移概率P,奖赏函数R 是未知的&#xff0c;或者状态X也是未知的 称为免模型学习&#xff08;model-free learning&#xff09; 目录&#xff1a; 1: 蒙特卡洛强化学习 2&#xff1a;同策略-蒙特卡洛强化学习 3&am…

阿里云免费服务器

文章目录 最近的阿里云活动By the way在云服务器ECS上搭建个人网站正文补充:定期释放补充:不知道阿里云服务器的密码怎么办?成果补充&#xff1a;怎么找到实例操作的后台&#xff1f;补充&#xff1a;怎么查看服务器到期时间&#xff1f; 究竟白嫖了多少&#xff1f;最后&…

修复dinput8.dll文件的缺失,以及修复dinput8.dll文件时需要注意什么

dinput8.dll文件通常在使用大型游戏时容易出现dinput8.dll文件丢失的情况&#xff0c;今天这篇文章将要教大家修复dinput8.dll文件的缺失&#xff0c;同时在修复dinput8.dll文件时需要注意些什么&#xff1f;防止文件在修复的过程中出现其他的错误。 dinput8.dll是DirectInput库…

部署ELK

一、elasticsearch #拉取镜像 docker pull elasticsearch:7.12.1 #创建ELK docker网络 docker network create elk #启动ELK docker run -d --name es --net elk -P -e "discovery.typesingle-node" elasticsearch:7.12.1 #拷贝配置文件 docker cp es:/usr/share/el…

Visual Studio Code 常用快捷键大全

Visual Studio Code 常用快捷键大全 快捷键是编码过程中经常使用&#xff0c;且能够极大提升效率的部分&#xff0c;这里给大家介绍一些VS Code中非常有用的快捷键。 打开和关闭侧边栏 Mac — Command B Windows — Ctrl B Ubuntu — Ctrl B 选择单词 Mac — Command D …

“第六十天”

SRAM和DRAM&#xff1a; DRAM&#xff1a;动态RAM&#xff08;随机存期存储器&#xff09;&#xff0c;是使用栅极电容存储信息的&#xff1b; SRAM&#xff1a;静态RAM&#xff0c;是使用双稳态触发器存储信息的。 重点在于DRAM由于要通过电容放电来表示信息&#xff0c;所…