AI学习第二天--监督学习半监督学习无监督学习

AI学习第二天--监督学习半监督学习无监督学习

news/2025/3/19 20:55:36/文章来源:https://blog.csdn.net/iisugar/article/details/146311486

目录

1. 监督学习（Supervised Learning）

比喻：

技术细节：

形象例子：

2. 无监督学习（Unsupervised Learning）

比喻：

技术细节：

形象例子：

3. 半监督学习（Semi-Supervised Learning）

比喻：

技术细节：

形象例子：

4. 三者的对比与选择

表格总结：

5. 实际案例对比

案例：电商平台用户分群

6. 关键逻辑总结

1. 监督学习（Supervised Learning）

比喻：

老师带着学生做题，每道题都有标准答案，学生通过练习学会解题方法。
核心：有标签的数据（答案已知）。

技术细节：

数据形式：输入（X）+ 标签（Y）。
- 例如：
  - 图像分类：图片（X） + 类别标签（Y，如“猫”或“狗”）。
  - 房价预测：房屋面积、位置（X） + 房价（Y）。
目标：模型学习输入到标签的映射关系（如 f(X)=Yf(X)=Y）。
常见算法：线性回归、决策树、神经网络等。

形象例子：

场景：学生学数学。

老师：
- 给出题目和答案（如“3+5=？” → 答案“8”）。
- 学生通过大量练习（如1000道题+答案）掌握加法规律。
模型：
- 输入“3+5”，输出“8”。
- 监督学习的关键：每一步都有明确的“正确答案”指导模型学习。

2. 无监督学习（Unsupervised Learning）

比喻：

学生自己探索一堆物品，没有老师指导，只能通过观察找出物品的共同特征或分组。
核心：无标签的数据（没有答案，需自行发现模式）。

技术细节：

数据形式：仅有输入（X），无标签（Y）。
- 例如：
  - 客户数据（年龄、收入、消费习惯） → 分群（如高收入用户群、低频购物群）。
  - 文本语料库 → 聚类为不同主题。
目标：模型发现数据中的内在结构（如分组、降维）。
常见算法：K-Means聚类、PCA降维、自编码器等。

形象例子：

场景：学生整理图书馆的书。

学生：
- 看到一堆书，但没有分类标签（如“科幻”“历史”）。
- 通过观察书的内容、作者、关键词，将书分为“小说”“科技”“历史”等类别。
模型：
- 输入客户数据，输出“客户A属于高价值用户群”。
- 无监督学习的关键：没有答案，模型自己“创造”规则。

3. 半监督学习（Semi-Supervised Learning）

比喻：

学生大部分时间自己探索，但偶尔老师给出几个题目的答案，学生结合少量答案和大量无标签数据学习。
核心：少量有标签数据 + 大量无标签数据。

技术细节：

数据形式：
- 少量有标签数据（X, Y） + 大量无标签数据（仅X）。
- 例如：
  - 医疗数据：100个标注的X光片（有疾病标签） + 10,000个未标注的X光片。
目标：利用少量标签和大量无标签数据提升模型性能。
常见方法：
- 标签传播：用少量标签数据推测无标签数据的标签。
- 自训练：模型先用有标签数据训练，再预测无标签数据，将高置信度预测结果作为新标签。

形象例子：

场景：学生学画画，但只有少量带标签的画作。

老师：
- 给出10张画作并标注“风景”“人物”等标签。
- 其他1000张画作无标签。
学生：
- 先用10张带标签的画学习特征（如“人物画有五官”）。
- 再观察无标签画作，推测它们的类别（如“这张画有山和树 → 可能是风景”）。
模型：
- 输入新画作，输出“风景”或“人物”。
- 半监督学习的关键：用少量标签引导，大量无标签数据扩展知识。

4. 三者的对比与选择

表格总结：

类型	数据形式	目标	适用场景	优缺点
监督学习	X（输入） + Y（标签）	学习输入到标签的映射	分类、回归（如图像识别、房价预测）	需大量标注数据，但模型性能通常更好。
无监督学习	X（输入）无标签	发现数据内在结构	聚类、降维（如客户分群、文本主题分析）	不需要标注数据，但结果可能需要人工解释。
半监督学习	少量(X,Y) + 大量X	结合有/无标签提升性能	标注成本高但数据量大的场景（如医疗、图像）	兼顾监督和无监督的优点，但实现复杂，需平衡两者。

5. 实际案例对比

案例：电商平台用户分群

监督学习：
- 数据：用户行为数据（点击、购买） + 标签（“高价值用户”或“低价值用户”）。
- 模型：训练分类器，预测新用户是否是高价值用户。
无监督学习：
- 数据：用户行为数据（无标签）。
- 模型：聚类为“高活跃用户群”“价格敏感用户群”等。
半监督学习：
- 数据：100个标注用户（高/低价值） + 10,000个无标签用户。
- 模型：用少量标签引导聚类，提升用户分群的准确性。

6. 关键逻辑总结

监督学习：有答案，学得准，但成本高。
无监督学习：无答案，靠探索，成本低但需解释。
半监督学习：少量答案+大量数据，性价比高，但需平衡。

用一句话概括：
“监督学习是‘有答案的考试’，无监督学习是‘无答案的探险’，半监督学习是‘带着少量答案去探险’。”

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/36004.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

【蓝桥杯每日一题】3.17

【蓝桥杯每日一题】3.17

🏝️专栏： 【蓝桥杯备篇】 🌅主页： f狐o狸x 他们说内存泄漏是bug，我说这是系统在逼我进化成SSR级程序员 OK来吧，不多废话，今天来点有难度的：二进制枚举二进制枚举，就是…

阅读更多...

Matlab 汽车振动多自由度非线性悬挂系统和参数研究

Matlab 汽车振动多自由度非线性悬挂系统和参数研究

1、内容简介略 Matlab 169-汽车振动多自由度非线性悬挂系统和参数研究可以交流、咨询、答疑 2、内容说明略第二章汽车模型建立 2.1 汽车悬架系统概述 2.1.1 悬架系统的结构和功能 2.1.2 悬架分类 2.2 四分之一车辆模型对于车辆动力学，一般都是研究其悬…

阅读更多...

hackmyvm-Smol

hackmyvm-Smol

信息收集 ┌──(root㉿kali)-[/home/kali] └─# arp-scan -I eth1 192.168.56.0/24 Interface: eth1, type: EN10MB, MAC: 00:0c:29:34:da:f5, IPv4: 192.168.56.103 WARNING: Cannot open MAC/Vendor file ieee-oui.txt: Permission denied WARNING: Cannot open MAC/Vendo…

阅读更多...

深度学习项目--基于DenseNet网络的“乳腺癌图像识别”，准确率90%+，pytorch复现

深度学习项目--基于DenseNet网络的“乳腺癌图像识别”，准确率90%+，pytorch复现

🍨 本文为🔗365天深度学习训练营中的学习记录博客🍖 原作者：K同学啊前言如果说最经典的神经网络，ResNet肯定是一个，从ResNet发布后，很多人做了修改，denseNet网络无疑是最成功的…

阅读更多...

基于x11vnc的ubuntu远程桌面

基于x11vnc的ubuntu远程桌面

1、安装VNC服务 sudo apt install x11vnc -y2、创建连接密码 sudo x11vnc -storepasswd3、安装lightdm服务 x11vnc 在默认的 GDM3 中不起作用，因此需要使用 lightdm 桌面管理环境 sudo apt install lightdm -y切换至lightdm，上一步已经切换则跳过该…

阅读更多...

Git 常用命令完全指南：从入门到高效协作

Git 常用命令完全指南：从入门到高效协作

文章需要结构清晰，涵盖从入门到进阶的常用命令，结合实例和注意事项，帮助用户快速掌握Git的核心功能，并应用到实际项目中一、仓库初始化与基础操作 1. 创建与克隆仓库 # 初始化本地仓库 git init# 克隆远程仓库（SSH方…

阅读更多...

【运维自动化-标准运维】如何实现一个最简单的流程编排

【运维自动化-标准运维】如何实现一个最简单的流程编排

流程编排是标准运维最核心的功能，通过将不同功能的原子插件在画布上可视化的拖拽编排，可以实现各种不同场景的跨系统工作流。标准运维流程根据实际运维操作场景梳理出来的操作步骤，通过不同的流转逻辑（并行、分支、条件并行&…

阅读更多...

【DeepSeek】HTML Api调用（支持V3和 R1，多轮对话、流式输出、对话保存、markdown格式支持）

【DeepSeek】HTML Api调用（支持V3和 R1，多轮对话、流式输出、对话保存、markdown格式支持）

文章目录一、项目结构二、功能支持三、使用方法四、待改进五、参数优化 ☘️ 项目地址：https://github.com/CQUPTLei/DeepSeek_HTML/tree/master 对话截图： 一、项目结构 C:\USERS\14134\DESKTOP\DEEPSEEK │ .gitignore │ DeepSeek.html # 所…

阅读更多...

烽火HG680-KB_海思HI3798MV310_安卓9.0_U盘强刷固件包及注意点说明

烽火HG680-KB_海思HI3798MV310_安卓9.0_U盘强刷固件包及注意点说明

之前发布过这个固件包，关于烽火HG680-KA／HG680-KB_海思HI3798MV310_安卓9.0_U盘强刷固件包详细说明一下，汇总总结一些常遇到的情况，这次固件会分开发布，以免混淆。上一个帖子地址：烽火HG680-KA&#xff0…

阅读更多...

蓝桥杯备赛(基础语法4）

蓝桥杯备赛(基础语法4）

冒泡排序冒泡排序的思想冒泡排序的思想是每次将最大的一下一下运到最右边，然后将最右边这个确定下来。再来确定第二大的，再确定第三大的... 对于数组 a [ ] ,具体的来说，每次确定操作就是从左往右扫描，如果 a [ i ] > a [ …

阅读更多...

【算法】力扣 713题：乘积小于 K 的子数组之深入思考

【算法】力扣 713题：乘积小于 K 的子数组之深入思考

文章目录前言题目：乘积小于 K 的子数组参考思路方法一：滑动窗口方法二：二分查找参考题解方法一：滑动窗口解法方法二：二分查找解法深入思考浮点精度？right - left 1？二分法？哈希优…

阅读更多...

超声重建，3D重建超声三维重建，三维可视化平台 UR 3D Reconstruction

超声重建，3D重建超声三维重建，三维可视化平台 UR 3D Reconstruction

1. 超声波3D重建技术的实现方法与算法技术概述 3D超声重建是一种基于2D超声图像生成3D体积数据的技术，广泛应用于医学影像领域。通过重建和可视化三维结构，3D超声能够显著提高诊断精度和效率，同时减少医生的脑力负担。本技术文档将详细阐述…

阅读更多...

Docker 部署 Graylog 日志管理系统

Docker 部署 Graylog 日志管理系统

Docker 部署 Graylog 日志管理系统前言一、准备工作二、Docker Compose 配置三、启动 Graylog 服务四、访问 Graylog Web 界面总结前言 Graylog 是一个开源的日志管理平台，专为实时日志收集、分析和可视化设计。它支持强大的搜索功能，并且与 Elastics…

阅读更多...

【图论】并查集的学习和使用

【图论】并查集的学习和使用

目录并查集是什么？ 举个例子组成父亲数组： find函数： union函数： 代码实现： fa[] 初始化code: find code： 递归实现: 非递归实现: union code : 画图模拟： 路径压缩&#xff1a…

阅读更多...

FPGA-流水灯

FPGA-流水灯

Quartus中使用Verilog实现根据之前所学内容，打开Quartus 软件，新建FPGA项目文件，建立好空项目过后，选择Verilog HDL File，因为我们要使用Verilog代码实现仿真。详细操作可参考往期博客： FPGA 实验报告&a…

阅读更多...

React19源码系列之createRoot的执行流程是怎么的？

React19源码系列之createRoot的执行流程是怎么的？

2024年12月5日，react发布了react19版本。后面一段时间都将学习它的源码，并着手记录。 react官网：react19新特性 https://react.dev/blog/2024/12/05/react-19 在用vite创建react项目的使用，main.tsx主文件都会有以下代码。 //i…

阅读更多...

全网首创/纯Qt/C++实现国标GB28181服务/实时视频/云台控制/预置位/录像回放和下载/事件订阅/语音对讲

全网首创/纯Qt/C++实现国标GB28181服务/实时视频/云台控制/预置位/录像回放和下载/事件订阅/语音对讲

一、前言说明用纯Qt来实现这个GB28181的想法很久了，具体可以追溯到2014年，一晃十年都过去了，总算是整体的框架和逻辑都打通了，总归还是杂七杂八的事情多，无法静下心来研究具体的协议，最开始初步了解协议后…

阅读更多...

Qt 实操记录:打造自己的“ QQ 音乐播放器”

Qt 实操记录:打造自己的“ QQ 音乐播放器”

目录一.界面设计1.成品界面分析2.head界面实现3.body界面实现4.主界面设置(1).设置无标题栏与阴影效果(2).重写鼠标事件实现拖拽二.自定义控件1.BtFrom界面设计2.推荐页面设计3.recBox页面设计4.recBoxItem页面设计(1).eventFilter介绍和使用(2).QJsonObject介绍和使用(3).向…

阅读更多...

如何打造安全稳定的亚马逊采购测评自养号下单系统？

如何打造安全稳定的亚马逊采购测评自养号下单系统？

在当今的电商领域，亚马逊作为全球领先的在线购物平台，其商品种类繁多，用户基数庞大，成为了众多商家和消费者的首选。而对于一些需要进行商品测评或市场调研的用户来说，拥有一个稳定、安全的亚马逊账号体系显得尤为重要…

阅读更多...

Python文字识别OCR

Python文字识别OCR

一.引言文字识别，也称为光学字符识别（Optical Character Recognition, OCR），是一种将不同形式的文档（如扫描的纸质文档、PDF文件或数字相机拍摄的图片）中的文字转换成可编辑和可搜索的数据的技术。随着技…

阅读更多...

最新文章

推荐文章