编程小白冲Kaggle每日打卡(12)--kaggle学堂:<机器学习简介>模型如何工作

Kaggle官方课程链接:How Models Work

本专栏旨在Kaggle官方课程的汉化,让大家更方便地看懂。

How Models Work

第一步,如果你是机器学习的新手。

Introduction

我们将从概述机器学习模型的工作原理和使用方法开始。如果你以前做过统计建模或机器学习,这可能会让你觉得很基本。别担心,我们很快就会建立强大的模型。

本课程将让您在经历以下场景时构建模型:

你表哥通过房地产投机赚了数百万美元。由于你对数据科学的兴趣,他主动提出与你成为商业伙伴。他会提供资金,你会提供预测各种房屋价值的模型。

你问你的堂兄过去是如何预测房地产价值的,他说这只是直觉。但更多的质疑表明,他从过去见过的房子中识别出了价格模式,并利用这些模式对他正在考虑的新房进行了预测。

机器学习的工作原理是一样的。我们将从一个名为决策树的模型开始。有更高级的模型可以给出更准确的预测。但是决策树很容易理解,它们是数据科学中一些最佳模型的基本构建块。

为了简单起见,我们将从最简单的决策树开始。

它将房屋分为两类。所考虑的任何房屋的预测价格都是同类房屋的历史平均价格。

我们使用数据来决定如何将房屋分为两组,然后再次确定每组的预测价格。从数据中捕获模式的这一步骤称为拟合或训练模型。用于拟合模型的数据称为训练数据。

模型如何拟合的细节(例如如何分割数据)足够复杂,我们将稍后保存。模型拟合后,您可以将其应用于新数据,以预测额外房屋的价格。

Improving the Decision Tree

以下两个决策树中,哪一个更有可能是拟合房地产训练数据的结果?

左边的决策树(决策树1)可能更有意义,因为它捕捉到了这样一个现实,即卧室更多的房子往往比卧室更少的房子售价更高。这种模型最大的缺点是它没有捕捉到影响房价的大多数因素,如浴室数量、地块大小、位置等。

你可以使用具有更多“分裂”的树来捕捉更多的因素。这些被称为“更深”的树。一个同时考虑每栋房子地块总面积的决策树可能看起来像这样:

你可以通过追踪决策树来预测任何房子的价格,总是选择与房子特征相对应的路径。这房子的预测价格是最低的。我们做出预测的底部点称为叶子。

叶子处的分割和值将由数据决定,因此是时候检查您将使用的数据了。

Continue

让我们更具体一点。是时候检查你的数据了。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/22394.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

企业知识库构建智慧协作平台

内容概要 现代企业知识库作为智慧协作平台的核心载体,其架构设计需兼顾知识资产的系统性沉淀与敏捷化应用。通过集中化管理机制,企业可将分散于各部门的文档、流程指南及项目经验转化为结构化数字资产,形成具备智能检索能力的知识图谱。在技…

Swiper插件的运用和学习

Swiper中文网-轮播图幻灯片js插件,H5页面前端开发 Swiper 是目前最流行的免费开源轮播组件之一,它功能强大、高度可定制且兼容性好,支持移动端手势操作和丰富的交互动画。 下载Swiper压缩包 轮播图演示页面。可以看见各种不同切换效果的轮播图 然后解压…

Git 合并冲突解决与状态分析笔记

前言 在使用 Git 进行代码管理时,合并分支是常见的操作之一。然而,在合并过程中可能会遇到冲突问题,尤其是在多人协作开发的场景下。本文将详细介绍如何解决 Git 合并冲突,并结合实际案例分析 git status 的输出含义。 背景 在…

ChromeDriver版本不匹配问题的解决

今天运行一个以前写的爬虫程序,遇到如下错误: selenium.common.exceptions.SessionNotCreatedException: Message: session not created: This version of ChromeDriver only supports Chrome version 121 Current browser version is 133.0.6943.98 w…

支持向量机(SVM):算法讲解与原理推导

1 SVM介绍 SVM是一个二类分类器,它的全称是Support Vector Machine,即支持向量机。 SVM的目标是找到一个超平面,使用两类数据离这个超平面越远越好,从而对新的数据分类更准确,即使分类器更加健壮。比如上面的图中&am…

华为云deepseek大模型平台:deepseek满血版

华为云硅基流动使用Chatbox接入DeepSeek-R1满血版671B 1、注册: 华为云deepseek大模型平台注册:https://cloud.siliconflow.cn/i/aDmz6aVN 说明:填写邀请码的话邀请和被邀请的账号都会获得2000 万 Tokens;2个帐号间不会与其他关联…

保姆级! 本地部署DeepSeek-R1大模型 安装Ollama Api 后,Postman本地调用 deepseek

要在Postman中访问Ollama API并调用DeepSeek模型,你需要遵循以下步骤。首先,确保你有一个有效的Ollama服务器实例运行中,并且DeepSeek模型已经被加载。 可以参考我的这篇博客 保姆级!使用Ollama本地部署DeepSeek-R1大模型 并java…

ESP32-S3 实战指南:BOOT-KEY 按键驱动开发全解析

一、基础知识 本篇我们使用 BOOT 按键来学习一下 GPIO 功能,首先补充一下相关术语介绍。 1、GPIO(General Purpose Input/Output) GPIO 是微控制器上的通用引脚,既可以作为输入(读取外部信号)&#xff0…

Win11 24h2 不能正常使用ensp的问题(已解决)

因为Win11 24h2的内核大小更改,目前virtualbox在7.1.4中更新解决了。所以Win11 24H2系统版本无法使用 5.x.xx的virtualbox版本,virtualbox对于这个5.x.xx版本早已停止维护,所以这个以后不会有调整。 对应的报错代码是 virtualbox错误代码&…

常用电脑,护眼软件推荐 f.lux 3400K | 撰写论文 paper

常用电脑?平均每天用 5 个小时?你就要考虑用一个护眼软件了,对皮肤也好。因为电脑屏幕有辐射,比如蓝光。 f.lux 作为一款专业护眼软件,值得使用。之前用了三年的 Iris Pro,现在 f.lux 做的更好了。 使用…

在 Mac ARM 架构的 macOS 系统上启用 F1 键作为 Snipaste 的截屏快捷键

在 Mac ARM 架构的 macOS 系统上启用 F1 键作为 Snipaste 的截屏快捷键,主要涉及到两个方面:确保 F1 键作为标准功能键工作 和 在 Snipaste 中设置 F1 为快捷键。 因为 Mac 默认情况下,F1-F12 键通常用作控制屏幕亮度、音量等系统功能的快捷键…

开源一款I2C电机驱动扩展板-FreakStudio多米诺系列

总线直流电机扩展板 原文链接: FreakStudio的博客 摘要 设计了一个I2C电机驱动板,通过I2C接口控制多个电机的转速和方向,支持刹车和减速功能。可连接16个扩展板,具有PWM输出、过流过热保护和可更换电机驱动芯片。支持按键控制…

Spring Security+JWT+Redis实现项目级前后端分离认证授权

1. 整体概述 权限管理包括用户身份认证和授权两部分,简称认证授权。对于需要访问控制到资源,用户首先经过身份认证,认证通过后用户具有该资源的访问权限方可访问。 1.1 认证概述 认证是确认用户身份的过程,确保用户是谁。 1.1.1 …

数据结构系列三:List+顺序表+ArrayList

数据结构系列三 一、List(1)什么是List(2)常见接口介绍(3)List的使用 二、顺序表与ArrayList(1)线性表(2)顺序表(3)顺序表常用方法的模…

全局变量,局部变量

在main函数中又定义一遍全局变量:会导致程序出错 因为在函数中调用这个全局变量时,调用的值是在头文件下面的初始值,虽然你在main函数中改变了变量的值,但是你在main函数中重新定义了 如果这样写会过50%的数据,因为在…

Unity贴图与模型相关知识

一、贴图 1.贴图的类型与形状 贴图类型 贴图形状 2.在Unity中可使用一张普通贴图来生成对应的法线贴图(但并不规范) 复制一张该贴图将复制后的贴图类型改为Normal Map 3.贴图的sRGB与Alpha sRGB:勾选此选项代表此贴图存储于Gamma空间中…

互联网搜索、联网搜索 API 的探索与公开接口、大模型联网搜索接口、全网搜索接口

互联网搜索、联网搜索 API 的探索与公开接口、大模型联网搜索接口、全网搜索接口 关键词:互联网搜索、API 接口、实时数据、大模型联网、智能问答、数据采集、技术实践、成本优势、市场对比 概述 在当前大模型及人工智能技术迅速发展的背景下,如何让离…

牛客练习赛134 —— B题 python 补题 + 题解

牛客练习赛134 B 题目描述 示例输入: 1 5 1 2 4 5 6 2 5 4 6 9示例输出: 32解题思路: 题目大意 给定一个2行n列的矩阵,允许交换两列一次,从左上角(1,1)走到右下角(2,n),每一步只能向右或向下移动&#x…

电脑开机一段时间就断网,只有重启才能恢复网络(就算插网线都不行),本篇文章直接解决,不要再看别人的垃圾方法啦

下面的是我解决问题的心路历程,不想看的可以直接跳到解决方法上面! 内心思路: w11电脑更新过系统后,我的电脑是常年不关机的,但是一天突然断网,试了很多方法都连不上,重启电脑就会好&#xff0…

Ubuntu部署ktransformers

准备工作 一台服务器 CPU:500G GPU:48G(NVIDIA4090) 系统:Ubuntu20.04(github的文档好像用的是22.04) 第一步:下载权重文件 1.下载hfd wget https://hf-mirror.com/hfd/hfd.s…