算法简介：K最近邻算法

算法简介：K最近邻算法

news/2024/12/23 4:41:36/文章来源:https://blog.csdn.net/qingttqing/article/details/143504420

KNN

1. 最近邻算法
- 1.1 回归
2. 机器学习
- OCR
- 创建垃圾邮件过滤器
- 预测股票市场

1. 最近邻算法

KNN（k-nearest neighbours）K最近邻算法：采用此算法进行分类，检索距离该元素最近的几个元素是什么类型，那么该元素即为什么类型。
在这里插入图片描述

创建推荐系统：找出相近的元素，将相近元素的特性赋予此元素。
特征提取：将元素的特性量化后，采用毕达哥拉斯公式进行衡量(表示两组数字之间的相似程度)。
$\sqrt{(x_1-x_2)^2+(y_1-y_2)^2+...+(z_1-z_2)^2}$

1.1 回归

KNN可以用来进行分类和回归。找到近邻的元素，采用近邻的元素特征进行对此元素进行分类和回归预测。
分类：编组。
回归：预测结果。

需要挑选合适的特征，进行适合的打分。

2. 机器学习

KNN算法为进行机器学习的最基础算法。如推荐系统

OCR

OCR指的是光学字符识别（optical character recognition），这意味着你可拍摄印刷页面的照片，计算机将自动识别出其中的文字。OCR算法提取线段、点和曲线等特征。

如何自动识别出这个数字是什么呢？可使用KNN。

浏览大量的数字图像，将这些数字的特征提取出来。
遇到新图像时，你提取该图像的特征，再找出它最近的邻居都是谁！

OCR的第一步是查看大量的数字图像并提取特征，这被称为训练（training）。大多数机器学习算法都包含训练的步骤：要让计算机完成任务，必须先训练它。

创建垃圾邮件过滤器

垃圾邮件过滤器使用一种简单算法——朴素贝叶斯分类器（Naive Bayes classifier），你首先需要使用一些数据对这个分类器进行训练。

假设你收到一封主题为“collect your million dollars now!”的邮件，这是垃圾邮件吗？你可研究这个句子中的每个单词，看看它在垃圾邮件中出现的概率是多少。例如，使用这个非常简单的模型时，发现只有单词million在垃圾邮件中出现过。朴素贝叶斯分类器能计算出邮件为垃圾邮件的概率，其应用领域与KNN相似。

预测股票市场

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/464561.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

力扣动态规划基础版（矩阵型）

62.不同路径（唯一路径问题） 62. 不同路径https://leetcode.cn/problems/unique-paths/ 方法一：动态规划找状态转移方程，也就是说它从左上角走到右下角，只能往右或者往下走，那么设置一个位置为&#xff…

阅读更多...

adb 常用命令汇总

adb 常用命令汇总

目录 adb 常用命令 1、显示已连接的设备列表 2、进入设备 3、安装 APK 文件到设备 4、卸载指定包名的应用 5、从设备中复制文件到本地 6、将本地文件复制到设备 7、查看设备日志信息 8、重启设备 9、截取设备屏幕截图 10、屏幕分辨率 11、屏幕密度 12、显示设备的…

阅读更多...

基于大语言模型（LLM）自主Agent 智能体综述

基于大语言模型（LLM）自主Agent 智能体综述

近年来，LLM(Large Language Model)取得了显著成功，并显示出了达到人类智能的巨大潜力。基于这种能力，使用LLM作为中央控制器来构建自助Agent，以获得类人决策能力。 Autonomous agents 又被称为智能体、Agent。指能够通过感知周围环境、进行规划以及执行动作来完成既定任务。…

阅读更多...

node.js模块化分析

node.js模块化分析

什么是Node.js模块化 Node.js中的模块化‌是指将一个大文件拆分成独立且相互依赖的多个小模块。每个JS文件被视为一个独立的模块，模块之间是互相不可见的。如果一个模块需要使用另一个模块，则需要使用指定的语法来引入该模块，并且只能使用模块…

阅读更多...

openstack之guardian介绍与实例创建过程

openstack之guardian介绍与实例创建过程

运行特征采集模块：扩展Ceilometer，采集存储网、业务网连通性、nova目录是否可读写； 收集模块：将采集到的数据存储到数据库中； 分析模块：根据采集的结果，分析各节点状态，并进行反向检…

阅读更多...

C语言 -- qsort的简单使用

C语言 -- qsort的简单使用

qsort函数一、介绍二、语法格式三、使用函数从小到大从大到小四、结语一、介绍 qsort 函数是 C 标准库中的一个通用排序函数，用于对数组进行快速排序。它定义在 <stdlib.h> 头文件中。这个非常灵活，因为它允许用户指定数组的元素类型、数组的大…

阅读更多...

unity3d————叉乘的知识点

unity3d————叉乘的知识点

一、向量叉乘的知识点定义与公式： 向量叉乘的定义为：对于两个三维向量a和b，它们的叉乘结果是一个向量c，记为cab。叉乘的计算公式为：c(y1z2-y2z1)i(x2z1-x1z2)j(x1y2-x2y1)k，其中a(x1, y1, z1)，…

阅读更多...

vue2和vue3在html中引用组件component方式不一样

vue2和vue3在html中引用组件component方式不一样

我的vue版本是：20.17.0 一、在HTML中，引用组件格式区别。 vue2引用组件可以是file.vue格式，需要导入：<script src"https://unpkg.com/http-vue-loader"></script>才可以识别vue格式。 vue3引用组件格式是…

阅读更多...

密码学知识点整理一：密码学概论

密码学知识点整理一：密码学概论

密码学是什么？ 密码学是一门研究编制密码和破译密码的技术科学。密码学，作为信息安全的核心技术之一，其重要性在于能够为信息传输提供安全保障，确保数据在存储或传输过程中的机密性、完整性与真实性不被破坏。从古至今&#x…

阅读更多...

我谈正态分布——正态偏态

我谈正态分布——正态偏态

目录 pdf和cdf参数标准正态分布期望和方差分布形态 3 σ 3\sigma 3σ原则正态和偏态正态偏态瑞利分布偏度 (Skewness)峰度 (Kurtosis) 比较正态分布的英文是Normal Distribution，normal是“正常”或“标准”的意思，中文翻译是正态，多完美的…

阅读更多...

杨传辉：云+AI 时代的一体化数据库｜OceanBase发布会实录

杨传辉：云+AI 时代的一体化数据库｜OceanBase发布会实录

在 2024 OceanBase 年度发布会上， OceanBase CTO 杨传辉进行了主题为《云和 AI 时代的一体化数据库战略思考》的演讲，本文为演讲实录，欢迎阅读。视频观看可点击：https://www.oceanbase.com/video/9001825 各位 OceanBase 的客…

阅读更多...

华为OD机试 - 无重复字符的元素长度乘积的最大值（Python/JS/C/C++ 2024 C卷 100分）

华为OD机试 - 无重复字符的元素长度乘积的最大值（Python/JS/C/C++ 2024 C卷 100分）

华为OD机试 2024E卷题库疯狂收录中，刷题点这里专栏导读本专栏收录于《华为OD机试真题（Python/JS/C/C）》。刷的越多，抽中的概率越大，私信哪吒，备注华为OD，加入华为OD刷题交流群，…

阅读更多...

【格式化查看JSON文件】coco的json文件内容都在一行如何按照json格式查看

【格式化查看JSON文件】coco的json文件内容都在一行如何按照json格式查看

文章目录 1.使用 Python 中的 json 库2. 使用浏览器3. notepad4. VSCode 如果COCO的JSON文件内容在一行显示，这通常意味着文件被压缩或者是在传输过程中出现了问题。 1.使用 Python 中的 json 库想更好地查看 COCO 格式的 JSON 标签，可以将其格式化为更…

阅读更多...

2025生物发酵展（济南）为生物制造产业注入新活力共谱行业新篇章

2025生物发酵展（济南）为生物制造产业注入新活力共谱行业新篇章

2025第十四届国际生物发酵展将于3月3-5日济南盛大举办！产业链逐步完整，展会面积再创历史新高，展览面积较上届增涨至60000平方米，专业观众40000，品牌展商800，同期活动会议增加至50场，展会同期将举…

阅读更多...

kafka里的consumer 是推还是拉？

kafka里的consumer 是推还是拉？

大家好，我是锋哥。今天分享关于【kafka里的consumer 是推还是拉？】面试题？希望对大家有帮助； kafka里的consumer 是推还是拉？ 1000道互联网大厂Java工程师精选面试题-Java资源分享网在Kafka中，消费者&…

阅读更多...

Visual Studio | 配置管理

Visual Studio | 配置管理

文章目录一、配置管理1、项目属性1.1、常规1.2、VC 目录1.3、C/C -> 常规1.4、C/C -> 预处理器1.5、C/C -> 预编译头1.6、连接器 -> 常规1.7、连接器 -> 输入 2、编辑2.1、显示空格或tab符一、配置管理 1、项目属性 1.1、常规字段功能目标平台版本用于生成…

阅读更多...

Docker打包自己项目推到Docker hub仓库（windows10）

Docker打包自己项目推到Docker hub仓库（windows10）

一、启用Hyper-V和容器特性 1.应用和功能 2.点击程序和功能 3.启用或关闭Windows功能 4.开启Hyper-V 和容器特性记得重启生效！！！ 二、安装WSL2：写文章-CSDN创作中心https://mp.csdn.net/mp_blog/creation/editor/143057041 三…

阅读更多...

js.轮转数组和旋转链表

js.轮转数组和旋转链表

这是两个相似的题型，一个是数组，另一个是链表。链接：189. 轮转数组 - 力扣（LeetCode） 题目： 给定一个整数数组 nums，将数组中的元素向右轮转 k 个位置，其中 k 是非负数。示例 1:…

阅读更多...

mysql left join group_concat 主表丢失数据

mysql left join group_concat 主表丢失数据

问题出现的场景： 有一个主表 a，一个子表 b a表有两条数据，a表第一条数据在b表中有一条子数据，a表第二条数据在b表中有两条子数据。现在想要查询出来a表的所有数据和a表的子表b的id，b的id 使用GROUP_CONCAT拼接有…

阅读更多...

Spring 中循环依赖三级缓存

Spring 中循环依赖三级缓存

在Spring框架中，循环依赖是一个常见的问题，它指的是两个或多个Bean之间互相依赖，形成一个闭环，导致无法准确地完成对象的创建和初始化。为了解决这个问题，Spring引入了三级缓存机制。以下是对Spring中循环依赖和三级缓…

阅读更多...

最新文章

推荐文章