【机器学习】机器学习工程实战-第2章 项目开始前

上一章:第1章 概述

文章目录

    • 2.1 机器学习项目的优先级排序
      • 2.1.1 机器学习的影响
      • 2.1.2 机器学习的成本
    • 2.2 估计机器学习项目的复杂度
      • 2.2.1 未知因素
      • 2.2.2 简化问题
      • 2.2.3 非线性进展
    • 2.3 确定机器学习项目的目标
      • 2.3.1 模型能做什么
      • 2.3.2 成功模型的属性
    • 2.4 构建机器学习团队
      • 2.4.1 两种文化
      • 2.4.2 机器学习团队的成员
    • 2.5 机器学习项目为何失败
      • 2.5.1 缺乏有经验的人才
      • 2.5.2 缺乏领导层的支持
      • 2.5.3 数据基础设施缺失
      • 2.5.4 数据标签的挑战
      • 2.5.5 谷仓式组织和缺乏协作
      • 2.5.6 技术上不可行的项目
      • 2.5.7 技术团队和业务团队之间缺乏协调
    • 2.6 小结

本部分主要是项目开始前的准备工作,主要是实际开展工作前可能遇到的问题以及可能面临的难题等,是站在整个工程的角度的经验。
对于缺乏整个项目经验的人来讲,或许不太好理解,甚至觉得无关紧要。但对于有丰富项目经验的人员来讲,算是一个比较深刻的总结,或许可以感同身受并从中吸取教训。
这部分内容我不作为笔记的重点,只是 简单列出大纲,有兴趣的同学可以自行查找相关资料。

2.1 机器学习项目的优先级排序

2.1.1 机器学习的影响

2.1.2 机器学习的成本

2.2 估计机器学习项目的复杂度

2.2.1 未知因素

2.2.2 简化问题

2.2.3 非线性进展

2.3 确定机器学习项目的目标

2.3.1 模型能做什么

2.3.2 成功模型的属性

2.4 构建机器学习团队

2.4.1 两种文化

2.4.2 机器学习团队的成员

2.5 机器学习项目为何失败

2.5.1 缺乏有经验的人才

2.5.2 缺乏领导层的支持

2.5.3 数据基础设施缺失

2.5.4 数据标签的挑战

2.5.5 谷仓式组织和缺乏协作

2.5.6 技术上不可行的项目

2.5.7 技术团队和业务团队之间缺乏协调

2.6 小结

虽然实际工作复杂多变,但本章内容偏向于描述,所以比较简单。
无论您是否理解,都请在关闭网页之前,利用2秒钟的时间,在脑海中迅速回顾一遍本章的框架!

下一章:第3章 数据收集和准备

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/38491.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【蓝桥杯】12111暖气冰场(多源BFS 或者 二分)

思路 这题可以用BFS做,也可以用二分来做。 用二分这里只提供一个思路:对时间来二分查找,check函数就是检查在特定的时间 t 0 t_0 t0​内每一个暖气炉的传播距离能否覆盖所有格子。 用BFS做: 由几个点开始向外扩散,知道…

【云上CPU玩转AIGC】——腾讯云高性能应用服务HAI已支持DeepSeek-R1模型预装环境和CPU算力

🎼个人主页:【Y小夜】 😎作者简介:一位双非学校的大三学生,编程爱好者, 专注于基础和实战分享,欢迎私信咨询! 🎆入门专栏:🎇【MySQL&#xff0…

【JavaEE】网络编程socket

1.❤️❤️前言~🥳🎉🎉🎉 Hello, Hello~ 亲爱的朋友们👋👋,这里是E绵绵呀✍️✍️。 如果你喜欢这篇文章,请别吝啬你的点赞❤️❤️和收藏📖📖。如果你对我的…

超硬核区块链算法仿真:联盟链PBFT多线程仿真实现 :c语言完全详解版

1 22年年底想用gpt做出一个pbft的算法仿真,到了25年终于可以结合gpt grok perplexcity deepseek等实现了!!!!! 1.1简化版 // 定义 Windows 版本,确保条件变量相关函数可用 #define _WIN32_W…

【并发编程】聊聊forkJoin的原理和最佳实践

对于线程池来说,其实本质就是一个生产者消费者的模式,而通过竞争的方式从队列中获取任务执行。本质上其实就是按照任务级别进行处理,但是对于一些可以分而治之的任务,传统的线程池没有办法分治处理。一是无法对大任务进行拆分&…

【数据预测】基于遗传算法GA的LSTM光伏功率预测 GA-LSTM光伏功率预测【Matlab代码#91】

文章目录 【可更换其他算法,获取资源请见文章第6节:资源获取】1. 遗传算法GA2. 长短期记忆网络LSTM3. 基于GA-LSTM的光伏功率预测4. 部分代码展示5. 运行结果展示6. 资源获取 【可更换其他算法,获取资源请见文章第6节:资源获取】 …

Java 填充 PDF 模版

制作 PDF 模版 安装 OnlyOffice 从 OnlyOffice 官网下载 OnlyOffice Desktop,安装过程很简单,一路下一步即可。用 OnlyOffice 制作 PDF 模版(表单) 使用 OnlyOffice 表单设计器,制作表单,如下图 注意命名…

使用安装 Kettle 教程 Pentoho 10.2.0.0-222 安装 连接mysql

流程 准备下载安装测试链接常见问题 准备 需要提前安装好 JDK 配置好环境变量 (教程看前文) 安装好mysql(教程看前文) 下载好pentaho链接数据库驱动 下载pentaho安装包 https://pentaho.com/wp-content/uploads/2024/04/three-s…

MySQL表的增加、查询、修改、删除的基础操作

MySQL表的增加、查询、修改、删除的基础操作 一、CRUD二、新增数据 insert2.1 单行数据 全列插入2.2 多行数据 指定列插入 三、查询 select3.1 全列查询(select *)3.2 指定列查询3.3 表达式查询3.4 去重:distinct3.5 带有排序的查询&#x…

Windows Server 2025 使用 IIS 搭建 ASP.NET 3.5 网站

开启远程桌面 参考文章Windows server开启远程桌面教程打开服务管理器。ECS 配置安全组,开启 3389Telnet 验证网络联通性 telnet x.x.x.x 338安装 Windows App,登录验证 安装 ASP.NET 3.5 1.参考文章Windows Server 2012安装 .NET Framework 3.5和 Wi…

Linux上位机开发实战(能用的开发板计算资源)

【 声明:版权所有,欢迎转载,请勿用于商业用途。 联系信箱:feixiaoxing 163.com】 大家所能想到的嵌入式上位机开发,如果是linux,同时涉及到嵌入式的话,一般都会认为是把pc linux的软件port到板子…

STM32中断

中断的基本概念 中断具体定义:操作系统课程里有清晰的阐述。 STM32中断:中断来了,主程序都得立即暂停,程序由硬件电路自动跳转到中断程序中。中断执行前,进行现场保护;中断执行后,会再还原现场…

maven在windows系统上的详细安装和配置

下载 Maven 安装包 去官网下载,下载链接 下载到指定位置,解压,之后在该目录下新建一个文件夹 【repository】,作为本地仓库 Maven 的配置 配置本地仓库 ① 打开上一步新建的目录 repository, 复制路径 ② 打开 con…

如何为AI开发选择合适的服务器?

选择适合的服务器可以为您的AI项目带来更高的效率,确保最佳性能、可扩展性和可靠性,从而实现无缝的开发与部署。 选择适合的AI开发服务器可能并不容易。您需要一台能够处理大量计算和大型数据集的服务器,同时它还需要符合您的预算并易于管理…

OpenCV中的矩阵操作

OpenCV中的矩阵操作主要围绕Mat类展开,涵盖创建、访问、运算及变换等。 1. 创建矩阵 ‌零矩阵/单位矩阵‌: Mat zeros Mat::zeros(3, 3, CV_32F); // 3x3浮点零矩阵 Mat eye Mat::eye(3, 3, CV_32F); // 3x3单位矩阵 自定义初始化‌&#xff1a…

【C++进阶】函数:深度解析 C++ 函数的 12 大进化特性

目录 一、函数基础 1.1 函数定义与声明 1.2 函数调用 1.3 引用参数 二、函数重载:同名函数的「多态魔法」(C 特有) 2.1 基础实现 2.2 重载决议流程图 2.3 与 C 语言的本质区别 2.4 实战陷阱 三、默认参数:接口的「弹性设…

spring boot 登入权限RBAC模式

首先准备好5张表 user_info表,用户的信息表 role表,角色表(比如超级管理员、管理员、审核员、采购......) 创建user_role表,user_info表,role表的中间表 注意了,role_id和user_id是 u…

C#里使用libxl来对列或行进行分组显示

有时候由于EXCEL里的行数很多, 需要把某些行进行隐藏起来,那么就需要使用到行或列进行隐藏的操作。 这时候需要使用函数GroupCols和GroupRows来对这些列或行进行分组。 分组不能出现交叉的情况,否则会抛出异常。 如下图所示: 可以使用下面的代码来输出上面的EXCEL: p…

LangChain 基础

一、LangChain 模块和体系 LangChain 是一个用于开发由大型语言模型(LLMs)驱动的应用程序的框架。 官方文档:https://python.langchain.com/docs/introduction/ LangChain 简化了LLM应用程序生命周期的每个阶段: 开发&#xf…

IDEA 快捷键ctrl+shift+f 无法全局搜索内容的问题及解决办法

本篇文章主要讲解IDEA、phpStrom、webStrom、pyCharm等jetbrains系列编辑器无法进行全局搜索内容问题的主要原因及解决办法。 日期:2025年3月22日 作者:任聪聪 现象描述: 1.按下ctrlshiftf 输入法转为了繁体。 2.快捷键ctrlshiftr 可以全局检…