机器学习入门介绍

各位大佬好 ,这里是阿川的博客 , 祝您变得更强

在这里插入图片描述 个人主页:在线OJ的阿川

大佬的支持和鼓励,将是我成长路上最大的动力 在这里插入图片描述

阿川水平有限,如有错误,欢迎大佬指正 在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

目录

  • 三大方向
  • 机器学习产生的原因
  • 机器如何学习
  • 模型评价
  • 应用层
  • 适用条件
  • 学习要弄清楚
    • 数据什么样
    • 研究哪些问题
    • 如何分门别类
    • 常见误区与局限
  • 工具栏
    • 四大必备工具
      • Anaconda
      • [Jupyter notebook](https://jupyter.org/)
      • Numpy(重点)
      • Matplotlib

机器学习

  • 计算机 从数据中学习规律并改善自身进行预测的过程

三大方向

在这里插入图片描述
其中深度学习为重点

机器学习产生的原因

  • 人与计算机理解方式不同
  • 规律系统不够用
  • 逻辑判断专家参与耗时耗力

机器如何学习

在这里插入图片描述
注意:我们期望机器在没有见过的数据集表现良好,所以在训练中会采用28原则

  • 80%的历史数据用来训练
  • 20%的数据用来测试

在这里插入图片描述

模型评价

模型要进行模型评价

在这里插入图片描述

应用层

  • 商品画像
  • 用户画像
  • 商品推荐
  • 搜索算法
  • 以画搜画
  • 商品排序
  • 人脸检测
  • 活体检测
  • 人脸识别

适用条件

  • 问题存在某种模式
    • 一般是人能够解决的,若人解决不了的,作为强人工智能领域
  • 难以人工总结定义
  • 足够样本数据
    • 小数据下会失效

学习要弄清楚

学习机器学习要弄清楚

在这里插入图片描述

数据什么样

  • 常用的公开数据集
  • 典型实例
  • 如何使用数据
  • 高维特征空间
  • 结构化与非结构化数据

研究哪些问题

  • 任务地图

在这里插入图片描述

  • 分类任务(重点)

    • 特征

      • 已知样本特征
      • 判断样本类别
      • 二分类,多分类,多标签分类
    • 二分类

    • 多分类

    • 多标签分类

      • 标签间不互斥
      • 概率和不为1
    • 更多实例

  • 回归任务(重点)

    • 特征

      • 用于预测
    • 线性回归

    • 多项式回归

      • 一个因变量
      • 一个或多个自变量
      • 任何函数都可以用多项式逼近
    • 逻辑回归

      • 实际上是分类
      • 细节很多,求法不同,导致在回归类

不管是分类还是回归,都属于监督学习

  • 类别标记
  • 直接反馈

无监督学习

  • 无标准答案,去探索某种规律或结构

强化学习

  • 研究环境与行动之间的互动,以获取最大化结果

如何分门别类

划分依据

  • 监督学习

    • 训练数据有标记
    • 基础而重要
  • 无监督学习

    • 训练数据未有标记
    • 聚类
    • 降维
      • 主成分分析
        • K均值算法
        • 密度聚类
        • 最大期望算法
      • 核方法
  • 半监督学习

    • 少量标记,大量无标记
  • 强化学习

    • 观测环境
    • 估计状态
    • 执行操作
    • 获得回报或惩罚
  • 批量学习

    • 先训练再使用
    • 需要大量的时间和计算资源
    • 通常都是高线完成
  • 在线学习

    • 循序渐进
    • 边学边用
  • 基于实例的学习

  • 基于模型的学习

常见误区与局限

  • 数据越多越好吗

    • 数据质量是关键
    • 多不意味着准确
    • 传统方法依然有用
  • 模型真的可信吗

    • 可解释性难题
    • 深度学习是个黑盒子
    • 深层学习有具优势
  • 随机和确定性哪个更好

    • 机器学习本质上是统计
    • 确定性依然十分重要
    • 随机与确定性间的平衡
  • 小样本集怎么办

    • 机器学习适合大数据
    • 很多问题是天然小数据
    • 小样本学习是机器学习的挑战
  • 推理而不只是判断

    • 机器学习尚在判断阶段
    • 抽象思维和逻辑思维推理远未实现
    • 数学依旧是汪洋大海
  • 机器学习是机会

    • 深度学习局限性凸显
    • 本质上是几何空间变换
    • 具体问题应具体分析

工具栏

四大必备工具

在这里插入图片描述

Anaconda

在这里插入图片描述

Jupyter notebook

  • 基础使用
    • 基础操作
      • 快捷键
      • markdown
  • 高级使用
    • %%writefile
    • %pycat
    • %run
    • %timeit
    • %time
    • %%timeit
    • %%time
    • %whos
    • %lsmagic
    • %magic

Numpy(重点)

  • 基础知识

    • 性能对比
  • 数组创建

    • 常用属性
      • ndim\shape\size
  • 创建数组

    • np.array()
    • ones/ones_alike
    • zeros/zeros_like
    • full/full_like 指定数值
    • empty/empty_like 实数组
    • arange/linspace 等量数组
    • random/rand/randint/randn/nomal/uniform/seed 随机数组
    • reshape 改变形状
    • help/? 查看文档
  • 基础索引

  • 数据合并与拆分

    • 合并
      • concatnade/vstack/hstack
    • 拆分
      • split/vsplit/hsplit
  • 矩阵运算

    • 一元运算
      • abs/sqrt/square/exp/log/ceil/floot/round/sincostan
    • 二元运算
      • dot/加速乘除/取余/幂运算
    • 矩阵运算
      • 加速乘除/dot/转查/逆矩阵/行列式
  • 统计运算

    • min/max
    • sum/mean/median/std/var
    • ptp/percentile/cumsum/diff/prod
  • arg运算

    • argmin/argmax/argsort/argpartition
  • 补齐索引和布尔索引

Matplotlib

  • 数据可视化基础
    • 拆线
    • 散点
    • 绘制设置

好的,到此为止啦,祝您变得更强

在这里插入图片描述

道阻且长 行则将至

个人主页:在线OJ的阿川大佬的支持和鼓励,将是我成长路上最大的动力 在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/328362.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Spring MVC(三) 参数传递

1 Controller到View的参数传递 在Spring MVC中,把值从Controller传递到View共有5中操作方法,分别是。 使用HttpServletRequest或HttpSession。使用ModelAndView。使用Map集合使用Model使用ModelMap 使用HttpServletRequest或HttpSession传值 使用HttpSe…

2024最新洗地机推荐,洗地机怎么选?热门品牌哪个最好用?

在现代生活中,忙碌的日常让家庭清洁变得更加繁重和耗时。然而,洗地机的引入彻底改变了这一状况。凭借其强大的清洁效果和简便的使用方式,洗地机能够迅速清除地面上的各种污垢,使清洁工作变得轻松自如。正因为如此,洗地…

geoserver SQL注入、Think PHP5 SQL注入、spring命令注入

文章目录 一、geoserver SQL注入CVE-2023-25157二、Think PHP5 SQL注入三、Spring Cloud Function SpEL表达式命令注入(CVE-2022-22963) 一、geoserver SQL注入CVE-2023-25157 介绍:GeoServer是一个开源的地理信息系统(GIS&#…

某攻防演练心得之随笔记

最近太忙了,忙于各种奇奇怪怪的事情,有攻防,有应急,有渗透,还成为了一段时间内的“word高级工程师”......有师傅说我现在更新的越来越慢了,是呀,其实我也不知道怎么了,每天各种新闻…

零基础10 天入门 Web3之第3天

10 天入门 Web3之第3天 什么是以太坊,以太坊能做什么?Web3 是互联网的下一代,它将使人们拥有自己的数据并控制自己的在线体验。Web3 基于区块链技术,该技术为安全、透明和可信的交易提供支持。我准备做一个 10 天的学习计划&…

Android 逆向

一、apk 查壳工具 ApkScan-PKID 相关APK文件可以在 豌豆荚 官网下载 ApkScan-PKID查壳工具 下载 - 简书 (jianshu.com) 二、脱壳工具:frida 1、Android端配置 frida-server: 该步骤需要使用到 adb,操作Android文件 Releases frida/frid…

【RAG 论文】IRCoT:基于 CoT 的交叉检索解决多步骤问题

论文:Interleaving Retrieval with Chain-of-Thought Reasoning for Knowledge-Intensive Multi-Step Questions ⭐⭐⭐⭐ ACL 2023, arXiv:2212.10509 Code: github.com/stonybrooknlp/ircot 论文速读 大多数 RAG 都是一次检索来辅助 LLM 生成,但是面对…

第3周 后端微服务基础架构与前端项目联调配备

第3周 后端微服务基础架构与前端项目联调配备 1. 微服务项目层次设计与Maven聚合1.1 项目层次设计1.2 父项目pom1.2.1 打包方式 1.3 创建通用 5. 如何掌握高效率插件Lombok?依赖配置日志级别在pojo使用日志Slf4j 6. 如何优雅的进行Rest响应封装?7. 如何掌…

怎么将视频转成图片?看看这个网站

在日常生活中我们常常会在一些特定的场合下想要将一些视频中某个场合瞬间提取出来做成动态图片。Gif动图作为我们日常生活、工作必不可少的,想要通过自己制作这种有动态效果的图片就可以用gif动画制作网站,不用下载软件,手机、pc都可以在线操…

红黑树底层封装map、set C++

目录 一、框架思考 三个问题 问题1的解决 问题2的解决: 问题3的解决: 二、泛型编程 1、仿函数的泛型编程 2、迭代器的泛型编程 3、typename: 4、/--重载 三、原码 红黑树 map set 一、框架思考 map和set都是使用红黑树底层&…

战网国际服注册教程 暴雪战网国际服账号注册一站式教程分享

战网国际版,也即Battle.net环球版,是由暴雪娱乐操刀的全球化游戏交流枢纽,它突破地理限制,拥抱全世界的游戏玩家。与仅限特定地区的版本不同,国际版为玩家开辟了无障碍通道,让他们得以自由探索暴雪庞大游戏…

怎样恢复E盘里删了的文件夹,2024让EasyRecovery来帮你轻松恢复

使用EasyRecovery易恢复进行数据恢复非常简单。首先,用户需要选择需要恢复的数据类型,如文档、图片、视频等。然后,软件会对选定的存储设备进行全面扫描,以寻找可恢复的数据。在扫描过程中,用户可以预览部分已找到的文…

vmstat命令详解

好的,以下是 vmstat 输出中各个部分及其字段的中文含义: 1. 进程 (Procs) r (运行队列) 含义: 等待CPU执行的进程数量。如果这个数字大于CPU数量,可能表示系统过载。 b (阻塞进程) 含义: 当前处于不可中断睡眠状态的进程数量,通…

【Linux】常用指令、热键与权限管理

一、常用指令 (1)ls 功能:列出指定目录下的所有子目录与文件 用法:ls (选项) (目录或文件名) 常用选项: -a:列出目录下的所有文件,包括隐藏…

基于springboot实现医药管理系统项目【项目源码+论文说明】

基于springboot实现医药管理系统演示 摘要 计算机网络发展到现在已经好几十年了,在理论上面已经有了很丰富的基础,并且在现实生活中也到处都在使用,可以说,经过几十年的发展,互联网技术已经把地域信息的隔阂给消除了&…

八大设计模式:适配器模式实现栈的泛型编程 | 通用数据结构接口的秘诀(文末送书)

🎬 鸽芷咕:个人主页 🔥 个人专栏: 《C干货基地》《粉丝福利》 ⛺️生活的理想,就是为了理想的生活! 引入 哈喽各位铁汁们好啊,我是博主鸽芷咕《C干货基地》是由我的襄阳家乡零食基地有感而发,不知道各位的…

【EasyX】快速入门——静态图形篇

1.基本说明 EasyX 是针对 C 的图形库,可以帮助 C/C 初学者快速上手图形和游戏编程。 比如,可以基于 EasyX 图形库很快的用几何图形画一个房子,或者一辆移动的小车,可以编写俄罗斯方块、贪吃蛇、黑白棋等小游戏,可以练…

【计算机毕业设计】springboot成都奥科厨具厂产品在线销售系统设计与实现

时代在飞速进步,每个行业都在努力发展现在先进技术,通过这些先进的技术来提高自己的水平和优势,成都奥科厨具厂产品在线销售系统当然不能排除在外。成都奥科厨具厂产品在线销售系统是在实际应用和 软件工程的开发原理之上,运用jav…

栈和队列经典面试题详解

目录 题目一:20. 有效的括号 - 力扣(LeetCode) 题目二:225. 用队列实现栈 - 力扣(LeetCode) 题目三:232. 用栈实现队列 - 力扣(LeetCode) 题目四:622. 设…

2024年最新软件测试面试题必问的1000题!

我了解的测试理论和方法包括以下几个方面: 黑盒测试与白盒测试: 黑盒测试:基于对软件系统外部行为进行测试,独立于内部代码实现细节。黑盒测试关注输入与输出之间的关系以及软件功能是否符合预期。白盒测试:基于对软件…