AI学习第二天--监督学习 半监督学习 无监督学习

目录

1. 监督学习(Supervised Learning)

比喻:

技术细节:

形象例子:

2. 无监督学习(Unsupervised Learning)

比喻:

技术细节:

形象例子:

3. 半监督学习(Semi-Supervised Learning)

比喻:

技术细节:

形象例子:

4. 三者的对比与选择

表格总结:

5. 实际案例对比

案例:电商平台用户分群

6. 关键逻辑总结


1. 监督学习(Supervised Learning)

比喻

老师带着学生做题,每道题都有标准答案,学生通过练习学会解题方法。
核心有标签的数据(答案已知)。


技术细节
  • 数据形式:输入(X)+ 标签(Y)。
    • 例如:
      • 图像分类:图片(X) + 类别标签(Y,如“猫”或“狗”)。
      • 房价预测:房屋面积、位置(X) + 房价(Y)。
  • 目标:模型学习输入到标签的映射关系(如 f(X)=Yf(X)=Y)。
  • 常见算法线性回归、决策树、神经网络等。

形象例子

场景:学生学数学。

  1. 老师
    • 给出题目和答案(如“3+5=?” → 答案“8”)。
    • 学生通过大量练习(如1000道题+答案)掌握加法规律。
  2. 模型
    • 输入“3+5”,输出“8”。
    • 监督学习的关键:每一步都有明确的“正确答案”指导模型学习。

2. 无监督学习(Unsupervised Learning)

比喻

学生自己探索一堆物品,没有老师指导,只能通过观察找出物品的共同特征或分组
核心无标签的数据(没有答案,需自行发现模式)。


技术细节
  • 数据形式:仅有输入(X),无标签(Y)。
    • 例如:
      • 客户数据(年龄、收入、消费习惯) → 分群(如高收入用户群、低频购物群)。
      • 文本语料库 → 聚类为不同主题。
  • 目标:模型发现数据中的内在结构(如分组、降维)。
  • 常见算法K-Means聚类、PCA降维、自编码器等。

形象例子

场景:学生整理图书馆的书。

  1. 学生
    • 看到一堆书,但没有分类标签(如“科幻”“历史”)。
    • 通过观察书的内容、作者、关键词,将书分为“小说”“科技”“历史”等类别。
  2. 模型
    • 输入客户数据,输出“客户A属于高价值用户群”。
    • 无监督学习的关键:没有答案,模型自己“创造”规则。

3. 半监督学习(Semi-Supervised Learning)

比喻

学生大部分时间自己探索,但偶尔老师给出几个题目的答案,学生结合少量答案和大量无标签数据学习。
核心少量有标签数据 + 大量无标签数据


技术细节
  • 数据形式
    • 少量有标签数据(X, Y) + 大量无标签数据(仅X)。
    • 例如:
      • 医疗数据:100个标注的X光片(有疾病标签) + 10,000个未标注的X光片。
  • 目标:利用少量标签和大量无标签数据提升模型性能。
  • 常见方法
    • 标签传播:用少量标签数据推测无标签数据的标签。
    • 自训练:模型先用有标签数据训练,再预测无标签数据,将高置信度预测结果作为新标签。

形象例子

场景:学生学画画,但只有少量带标签的画作。

  1. 老师
    • 给出10张画作并标注“风景”“人物”等标签。
    • 其他1000张画作无标签。
  2. 学生
    • 先用10张带标签的画学习特征(如“人物画有五官”)。
    • 再观察无标签画作,推测它们的类别(如“这张画有山和树 → 可能是风景”)。
  3. 模型
    • 输入新画作,输出“风景”或“人物”。
    • 半监督学习的关键:用少量标签引导,大量无标签数据扩展知识。

4. 三者的对比与选择

表格总结
类型数据形式目标适用场景优缺点
监督学习X(输入) + Y(标签)学习输入到标签的映射分类、回归(如图像识别、房价预测)需大量标注数据,但模型性能通常更好。
无监督学习X(输入)无标签发现数据内在结构聚类、降维(如客户分群、文本主题分析)不需要标注数据,但结果可能需要人工解释。
半监督学习少量(X,Y) + 大量X结合有/无标签提升性能标注成本高但数据量大的场景(如医疗、图像)兼顾监督和无监督的优点,但实现复杂,需平衡两者。

5. 实际案例对比

案例:电商平台用户分群
  • 监督学习
    • 数据:用户行为数据(点击、购买) + 标签(“高价值用户”或“低价值用户”)。
    • 模型:训练分类器,预测新用户是否是高价值用户。
  • 无监督学习
    • 数据:用户行为数据(无标签)。
    • 模型:聚类为“高活跃用户群”“价格敏感用户群”等。
  • 半监督学习
    • 数据:100个标注用户(高/低价值) + 10,000个无标签用户。
    • 模型:用少量标签引导聚类,提升用户分群的准确性。

6. 关键逻辑总结

  • 监督学习有答案,学得准,但成本高
  • 无监督学习无答案,靠探索,成本低但需解释
  • 半监督学习少量答案+大量数据,性价比高,但需平衡

用一句话概括:
“监督学习是‘有答案的考试’,无监督学习是‘无答案的探险’,半监督学习是‘带着少量答案去探险’。”

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/36004.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【蓝桥杯每日一题】3.17

🏝️专栏: 【蓝桥杯备篇】 🌅主页: f狐o狸x 他们说内存泄漏是bug,我说这是系统在逼我进化成SSR级程序员 OK来吧,不多废话,今天来点有难度的:二进制枚举 二进制枚举,就是…

Matlab 汽车振动多自由度非线性悬挂系统和参数研究

1、内容简介 略 Matlab 169-汽车振动多自由度非线性悬挂系统和参数研究 可以交流、咨询、答疑 2、内容说明 略 第二章 汽车模型建立 2.1 汽车悬架系统概述 2.1.1 悬架系统的结构和功能 2.1.2 悬架分类 2.2 四分之一车辆模型 对于车辆动力学,一般都是研究其悬…

hackmyvm-Smol

信息收集 ┌──(root㉿kali)-[/home/kali] └─# arp-scan -I eth1 192.168.56.0/24 Interface: eth1, type: EN10MB, MAC: 00:0c:29:34:da:f5, IPv4: 192.168.56.103 WARNING: Cannot open MAC/Vendor file ieee-oui.txt: Permission denied WARNING: Cannot open MAC/Vendo…

深度学习项目--基于DenseNet网络的“乳腺癌图像识别”,准确率90%+,pytorch复现

🍨 本文为🔗365天深度学习训练营 中的学习记录博客🍖 原作者:K同学啊 前言 如果说最经典的神经网络,ResNet肯定是一个,从ResNet发布后,很多人做了修改,denseNet网络无疑是最成功的…

基于x11vnc的ubuntu远程桌面

1、安装VNC服务 sudo apt install x11vnc -y2、创建连接密码 sudo x11vnc -storepasswd3、安装lightdm服务 x11vnc 在 默认的 GDM3 中不起作用,因此需要使用 lightdm 桌面管理环境 sudo apt install lightdm -y切换至lightdm,上一步已经切换则跳过该…

Git 常用命令完全指南:从入门到高效协作

文章需要结构清晰,涵盖从入门到进阶的常用命令,结合实例和注意事项,帮助用户快速掌握Git的核心功能,并应用到实际项目中 一、仓库初始化与基础操作 1. 创建与克隆仓库 # 初始化本地仓库 git init# 克隆远程仓库(SSH方…

【运维自动化-标准运维】如何实现一个最简单的流程编排

流程编排是标准运维最核心的功能,通过将不同功能的原子插件在画布上可视化的拖拽编排,可以实现各种不同场景的跨系统工作流。标准运维流程 根据实际运维操作场景梳理出来的操作步骤,通过不同的流转逻辑(并行、分支、条件并行&…

【DeepSeek】HTML Api调用(支持V3和 R1,多轮对话、流式输出、对话保存、markdown格式支持)

文章目录 一、项目结构二、功能支持三、使用方法四、待改进五、参数优化 ☘️ 项目地址:https://github.com/CQUPTLei/DeepSeek_HTML/tree/master 对话截图: 一、项目结构 C:\USERS\14134\DESKTOP\DEEPSEEK │ .gitignore │ DeepSeek.html # 所…

烽火HG680-KB_海思HI3798MV310_安卓9.0_U盘强刷固件包及注意点说明

之前发布过这个固件包,关于烽火HG680-KA/HG680-KB_海思HI3798MV310_安卓9.0_U盘强刷固件包详细说明一下,汇总总结一些常遇到的情况,这次固件会分开发布,以免混淆。 上一个帖子地址:烽火HG680-KA&#xff0…

蓝桥杯备赛(基础语法4)

冒泡排序 冒泡排序的思想 冒泡排序的思想是每次将最大的一下一下运到最右边,然后将最右边这个确定下来。再来确定第二大的,再确定第三大的... 对于数组 a [ ] ,具体的来说,每次确定操作就是从左往右扫描,如果 a [ i ] > a [ …

【算法】力扣 713题:乘积小于 K 的子数组之深入思考

文章目录 前言题目:乘积小于 K 的子数组参考思路方法一:滑动窗口方法二:二分查找 参考题解方法一:滑动窗口解法方法二:二分查找解法 深入思考浮点精度?right - left 1?二分法?哈希优…

超声重建,3D重建 超声三维重建,三维可视化平台 UR 3D Reconstruction

1. 超声波3D重建技术的实现方法与算法 技术概述 3D超声重建是一种基于2D超声图像生成3D体积数据的技术,广泛应用于医学影像领域。通过重建和可视化三维结构,3D超声能够显著提高诊断精度和效率,同时减少医生的脑力负担。本技术文档将详细阐述…

Docker 部署 Graylog 日志管理系统

Docker 部署 Graylog 日志管理系统 前言一、准备工作二、Docker Compose 配置三、启动 Graylog 服务四、访问 Graylog Web 界面总结 前言 Graylog 是一个开源的日志管理平台,专为实时日志收集、分析和可视化设计。它支持强大的搜索功能,并且与 Elastics…

【图论】并查集的学习和使用

目录 并查集是什么? 举个例子 组成 父亲数组: find函数: union函数: 代码实现: fa[] 初始化code: find code: 递归实现: 非递归实现: union code : 画图模拟: 路径压缩&#xff1a…

FPGA-流水灯

Quartus中使用Verilog实现 根据之前所学内容,打开Quartus 软件,新建FPGA项目文件,建立好空项目过后,选择Verilog HDL File,因为我们要使用Verilog代码实现仿真。 详细操作可参考往期博客: FPGA 实验报告&a…

React19源码系列之createRoot的执行流程是怎么的?

2024年12月5日,react发布了react19版本。后面一段时间都将学习它的源码,并着手记录。 react官网:react19新特性 https://react.dev/blog/2024/12/05/react-19 在用vite创建react项目的使用,main.tsx主文件都会有以下代码。 //i…

全网首创/纯Qt/C++实现国标GB28181服务/实时视频/云台控制/预置位/录像回放和下载/事件订阅/语音对讲

一、前言说明 用纯Qt来实现这个GB28181的想法很久了,具体可以追溯到2014年,一晃十年都过去了,总算是整体的框架和逻辑都打通了,总归还是杂七杂八的事情多,无法静下心来研究具体的协议,最开始初步了解协议后…

Qt 实操记录:打造自己的“ QQ 音乐播放器”

目录 一.界面设计1.成品界面分析2.head界面实现3.body界面实现4.主界面设置(1).设置无标题栏与阴影效果(2).重写鼠标事件实现拖拽 二.自定义控件1.BtFrom界面设计2.推荐页面设计3.recBox页面设计4.recBoxItem页面设计(1).eventFilter介绍和使用(2).QJsonObject介绍和使用(3).向…

如何打造安全稳定的亚马逊采购测评自养号下单系统?

在当今的电商领域,亚马逊作为全球领先的在线购物平台,其商品种类繁多,用户基数庞大,成为了众多商家和消费者的首选。而对于一些需要进行商品测评或市场调研的用户来说,拥有一个稳定、安全的亚马逊账号体系显得尤为重要…

Python文字识别OCR

一.引言 文字识别,也称为光学字符识别(Optical Character Recognition, OCR),是一种将不同形式的文档(如扫描的纸质文档、PDF文件或数字相机拍摄的图片)中的文字转换成可编辑和可搜索的数据的技术。随着技…