【Python机器学习】k近邻——模型复杂度与泛化能力的关系

【Python机器学习】k近邻——模型复杂度与泛化能力的关系

news/2024/12/25 23:57:09/文章来源:https://blog.csdn.net/weixin_39407597/article/details/135415158

以某数据进行研究，先将数据集分为训练集和测试集，然后用不同的邻居数对训练集合测试集的新能进行评估：


from sklearn.datasets import load_breast_cancer
from sklearn.model_selection import train_test_split
from sklearn.neighbors import KNeighborsClassifier
import matplotlib.pyplot as pltcancer=load_breast_cancer()
X_train,X_test,y_train,y_test=train_test_split(cancer.data,cancer.target,stratify=cancer.target,random_state=66
)
plt.rcParams['font.sans-serif']=['SimHei']
training_accuracy=[]
test_accuracy=[]
neighbors_settings=range(1,11)for n_neighbors in neighbors_settings:clf=KNeighborsClassifier(n_neighbors=n_neighbors)clf.fit(X_train,y_train)training_accuracy.append(clf.score(X_train,y_train))test_accuracy.append(clf.score(X_test,y_test))plt.plot(neighbors_settings,training_accuracy,label='训练集精度')
plt.plot(neighbors_settings,test_accuracy,label='泛化精度')
plt.xlabel('邻居数')
plt.ylabel('精度')
plt.legend()
plt.show()

从结果上来看，进考虑单一近邻时，数据集上的预测结果非常完美，随着邻居个数的增多，模型变得简单，精度也随之下降。最佳性能在中间处，大概邻居为6个的时候。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/231805.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

日程安排小程序实战教程

日程安排小程序实战教程

日常中我们经常有一些事情需要提醒自己，使用日历的形式比较符合实际的使用习惯。本篇我们就利用微搭低代码工具带着大家开发一款日程安排的小程序。 1 创建数据源登录微搭低代码控制台，打开数据模型，点击创建输入数据源的名称日程安排 …

阅读更多...

记录第一次在GitHub上面提交Issue

记录第一次在GitHub上面提交Issue

第一次在GitHub上面提交Issue，记录一下。对着源码调了好久才发现，问题并不在程序而在模型（虽然只是一个很小的问题，但是能够解决问题，并且做出了自己的一点小小贡献，还是很开心。嘻嘻，发博客记…

阅读更多...

BART论文解读：BERT和GPT结合起来会发生什么？

BART论文解读：BERT和GPT结合起来会发生什么？

BART:Denoising Sequence-to-Sequence Pre-training for Natural Language Generation, Translation, and Comprehension 主要工作提出了BART (Bidirectional and Auto-Regressive Transformers)， 是一种用于自然语言生成、翻译和理解的序列到序列的预训练方法。它…

阅读更多...

stable diffusion 基础教程-提示词之光的用法

stable diffusion 基础教程-提示词之光的用法

基图 prompt: masterpiece,best quality,1girl,solo,looking at viewer,brown hair,hair between eyes,bangs,very long hair,red eyes,blush,bare shoulders,(white sundress),full body,Negative prompt: EasyNegative,badhandv4,nsfw,lowres,bad anatomy,bad hands,text…

阅读更多...

【DevOps-07-2】Sonarqube基本使用

【DevOps-07-2】Sonarqube基本使用

一、简要说明 Sonar Qube的使用方式很多，Maven可以整合，也可以采用sonar-scanner的方式，再查看Sonar Qube的检测效果 Sonarqube集成在Maven实现代码检测使用sonar-scanner客户端的方式二、Sonarqube管理后台安装中文插件 1、登录Sonarqube管…

阅读更多...

数据结构和算法-插入排序（算法效率折半优化顺序表与链表插入排序代码实现）

数据结构和算法-插入排序（算法效率折半优化顺序表与链表插入排序代码实现）

文章目录插入排序算法实现算法效率分析优化-折半插入排序代码实现对链表进行插入排序小结插入排序首先49当作第一个已经排好序得元素，将第二个元素与前面得元素对比，发现小于49，于是49移动位置此时将65与之前元素对比，发现其…

阅读更多...

C语言编译器（C语言编程软件）完全攻略（第二部分：与编译器相关的几个知识点）

C语言编译器（C语言编程软件）完全攻略（第二部分：与编译器相关的几个知识点）

介绍常用C语言编译器的安装、配置和使用。二、与编译器相关的几个知识点上节我们介绍了编译器和 IDE 的概念，大家肯定希望赶紧实践一下，用 IDE 真正地运行一段C语言代码来看看效果，这样能够更快地获得成就感。但是，使用 IDE …

阅读更多...

Linux第20步_在虚拟机上安装“Visual Studio Code”

Linux第20步_在虚拟机上安装“Visual Studio Code”

1、双击windows系统桌面上的“FileZilla Client.exe”，打开FTP客户端，点击03软件下的Visual Studio Code，发现code_1.50.1-1602600906_amd64。 2、点击“文件”，然后点击“站点管理器”，见下图操作： 3、点…

阅读更多...

vr体验馆用什么软件计时计费，如遇到停电软件程序如何恢复时间

vr体验馆用什么软件计时计费，如遇到停电软件程序如何恢复时间

vr体验馆用什么软件计时计费，如遇到停电软件程序如何恢复时间一、软件程序问答如下图，软件以佳易王vr体验馆计时计费软件V17.9为例说明 1、软件如何计时间？ 点击相应编号的开始计时按钮即可 2、遇到停电再打开软件时间可以恢复吗&…

阅读更多...

在 Oracle 数据库表中加载多个数据文件

在 Oracle 数据库表中加载多个数据文件

在本文中，我将展示 SQL 加载器 Unix 脚本实用程序的强大功能，其中 SQL 加载器可以使用自动 shell 脚本加载多个数据文件。这在处理大量数据以及需要将数据从一个系统移动到另一个系统时非常有用。它适合涉及大量历史数据的迁移项目。那么就不可能为每…

阅读更多...

自然语言处理24-T5模型的介绍与训练过程，利用简单构造数据训练微调该模型，体验整个过程

自然语言处理24-T5模型的介绍与训练过程，利用简单构造数据训练微调该模型，体验整个过程

大家好，我是微学AI，今天给大家介绍一下自然语言处理24-T5模型的介绍与训练过程，利用简单构造数据训练微调该模型，体验整个过程。在大模型ChatGPT发布之前，NLP领域是BERT,T5模型为主导，T5（Text-to-Text Transfer Transformer）是一种由Google Brain团队在2019年提出的自然…

阅读更多...

大数据概念：数据网格和DataOps

大数据概念：数据网格和DataOps

数据网格（Data Mesh） 一种新型的数据架构模式，旨在解决传统数据架构中存在的一些问题，例如数据孤岛、数据冗余、数据安全等。数据网格将数据作为一种服务，通过在分布式环境中提供数据服务，实现数据的共享和…

阅读更多...

多内层神经网络具有先天的不可解释性

多内层神经网络具有先天的不可解释性

多层神经网络的不可解释性是指其内部的决策过程很难被人类理解和解释。这主要是因为多层神经网络具有大量的神经元和多个层次的连接，使得网络的决策过程变得非常复杂。具体而言，多层神经网络中每一层的神经元会根据输入的特征进行加权组合和非线性变换&…

阅读更多...

Centos服务器安装Certbot以webroot的方式定时申请SSL免费证书

Centos服务器安装Certbot以webroot的方式定时申请SSL免费证书

最近发现原先免费一年的SSL证书都改为3个月的有效期了，原先一年操作一次还能接受，现在3个月就要手动续期整的太慢烦了，还是让程序自动给处理下吧， 安装 Certbot yum install epel-release -y yum install certbot -yEPEL是由 Fe…

阅读更多...

系统安全及应用

系统安全及应用

文章目录系统安全及应用一、账号安全基本措施1、系统账号清理1.1 将用户设置为无法登录1.2 锁定长期不使用的账号1.3 删除无用的账户1.4 清空一个账号密码1.5 锁定账户文件passwd、shadow 2、密码安全控制设置密码有效期 3、命令历史限制3.1 减少命令记录条数3.2 登录时自动清…

阅读更多...

13. 强化学习编程实验1-在格子世界中寻宝(1)

13. 强化学习编程实验1-在格子世界中寻宝(1)

文章目录 1.实验目的2.任务描述3.任务分析3.1 待求问题是多步决策问题否3.2 问题求解过程是一个马尔科夫决策过程3.3 状态空间S的确定3.4 动作空间A的确定3.5 状态转移概率P的确定3.6 立即回报R的确定3.7 折扣 γ \gamma γ的确定 4. 编程架构4.1 程序中有哪些对象和类4.2 环境…

阅读更多...

pyfolio工具结合backtrader分析量化策略组合，附源码+问题分析

pyfolio工具结合backtrader分析量化策略组合，附源码+问题分析

pyfolio可以分析backtrader的策略，并生成一系列好看的图表，但是由于pyfolio直接install的稳定版有缺陷，开发版也存在诸多问题，使用的依赖版本都偏低，试用了一下之后还是更推荐quantstats。 1、安装依赖 pip install …

阅读更多...

数据采集有哪些方法?HTTP代理起到什么作用？

数据采集有哪些方法?HTTP代理起到什么作用？

在这个数字化的时代，数据就如同生活中不可或缺的元素，我们的行为、喜好、甚至是想法都被转化成了数字化的信息。那么，现代社会是如何进行数据的采集的呢？让我们一同来看看！ 1. 网络浏览行为的追踪在我们浏览互联网的…

阅读更多...

【AI视野·今日NLP 自然语言处理论文速览第六十六期】Tue, 31 Oct 2023

【AI视野·今日NLP 自然语言处理论文速览第六十六期】Tue, 31 Oct 2023

AI视野今日CS.NLP 自然语言处理论文速览 Tue, 31 Oct 2023 (showing first 100 of 141 entries) Totally 100 papers 👉上期速览✈更多精彩请移步主页 Daily Computation and Language Papers The Eval4NLP 2023 Shared Task on Prompting Large Language Models a…

阅读更多...

解读 $mash 通证 “Fair Launch” 规则，将公平发挥极致？（Staking 玩法）

解读 $mash 通证 “Fair Launch” 规则，将公平发挥极致？（Staking 玩法）

Solmash是Solana生态中由社区主导的铭文资产LaunchPad平台，该平台旨在为Solana原生铭文项目，以及通过其合作伙伴SoBit跨链桥桥接到Solana的Bitcoin生态铭文项目提供更广泛的启动机会。有了Solmash，将会有更多的Solana生态的铭文项目、资产通过…

阅读更多...

最新文章

推荐文章