【SCAU数据挖掘】数据挖掘期末总复习题库应用题及解析

1.

给定圆的半径为e ,令 MinPts=3,考虑下面两幅图。


(1)哪些对象是核心对象?       

        m,p,o,r(因为这些核心对象在半径e的范围内都至少包含MinPts=3个对象)


(2)哪些对象是直接密度可达的?        

        对象q是从m直接密度可达的。对象m从p直接密度可达的。


(3)哪些对象是密度可达的?

        对象q是从p(间接)密度可达的(因为q从m直接密度可达,m从p直接密度可达。)

        r和s是从o密度可达的


(4)哪些对象是密度相连的?

        r和s是从o密度可达的,所以r和s是密度相连的。

核心对象:如果一个对象的ε-邻域内至少包含MinPts个对象,则该对象为核心对象。在这里,ε是邻域半径,MinPts是给定的最小点数。
直接密度可达:如果对象p在对象q的ε-邻域内,且q是核心对象,那么对象p从对象q出发是直接密度可达的。

密度可达:如果存在一个对象链p1, p2, ..., pn,其中p1=q,pn=p,且pi+1从pi关于ε和MinPts直接密度可达,那么对象p从对象q出发是密度可达的。
密度相连:如果对象集合D中存在一个对象o,使得对象p和q都是从o关于ε和MinPts密度可达的,那么对象p和q是关于ε和MinPts密度相连的。

2.相异性计算

给定两个元组(22,1,42,10)和(20,0,36,8):
(1)计算这两个对象之间的欧几里得距离。
(2)计算这两个对象之间的曼哈顿距离。
(3)使用q=3,计算这两个对象之间的闵可夫斯基距离。
(4)计算这两个对象之间的上确界距离。

欧几里得距离(Euclidean Distance):两点之间的直线距离
曼哈顿距离(Manhattan Distance):是两点在标准坐标系上的绝对轴距总和
上确界距离(Supremum Distance):是两点在各维度上距离的最大值

(1)

d=sqrt((22-20)^2+(1-0)^2+(42-36)^2+(10-8)^2)=sqrt(45)

(2)

d=∣22−20∣+∣1−0∣+∣42−36∣+∣10−8∣=2+1+6+2=11

(3)d=max(|p-q|)=6

(4)

d=max(∣22−20∣,∣1−0∣,∣42−36∣,∣10−8∣)=max(2,1,6,2)=6

3.

对于数据:{12,9,7,6,20,100,35,21,11,18,25,37},完成以下任务:

(1)计算它的平均值,20%的截断均值和中位数,并说明这三个统计特征在描述数据集方面的特点。

(2)使用最小-最大规范方法将其中的6,100,35转换到[0,1]。

(1)

平均值 = (12 + 9 + 7 + 6 + 20 + 100 + 35 + 21 + 11 + 18 + 25 + 37) / 12 = 25.08

平均值反应了数据集的平均水平,容易受到极端值的影响。

20%截断均值:丢弃高端和低端(20/2)%的数据,即丢弃最大和最小的12×0.1=1.2向上取整到2个的数据
首先将数据从小到大排序: {6, 7, 9, 11, 12, 18, 20, 21, 25, 35, 37, 100}
去掉最小的2个和最大的2个
{9, 11, 12, 18, 20, 21, 25, 35}
20%截断均值 = (9 + 11 + 12 + 18 + 20 + 21 + 25 + 35) / 8 = 18.875

截断均值通过去掉一部分极端值来减少极端值对平均值的影响,更能反映大多数数据的中心趋势。

中位数(18+20)/2=19

中位数将数据集分为两半,对于偏态分布的数据集,中位数更能代表数据的中心位置。

(2)

最小-最大规范化:将待转换数据减去最小值,再除以极差(最大值-最小值)
原数据集中最小值为6,最大值为100
极差 = 100 - 6 = 94

6的规范化值 = (6 - 6) / 94 = 0
100的规范化值 = (100 - 6) / 94 = 1
35的规范化值 = (35 - 6) / 94 = 0.3085
所以6、100、35分别规范化为0、1、0.3085
 

4.

对于如下的前馈神经网络,假设现在有一个训练样本,X={1,0,1},其对应的类标号(标签)为1,节点4、5、6的激活函数为sigmoid函数,结构如下图所示:

网络的初始输入、权值(w)和偏置值(4、5、6节点分别为)如下表所示:

(1)请计算节点4、5、6的净输入和输出


(2)请计算节点4、5、6的误差


(3)假设学习率为0.9,请计算上表中所有权值和偏置的一次更新。


(4)请问什么是梯度消失?

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/359576.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

智慧在线医疗在线诊疗APP患者端+医生端音视频诊疗并开处方

智慧在线医疗:音视频诊疗新纪元 🌐 智慧医疗新篇章 随着科技的飞速发展,智慧医疗正逐步走进我们的生活。特别是在线医疗,凭借其便捷、高效的特点,已成为许多患者的首选。而其中的“智慧在线医疗患者端医生端音视频诊疗…

使用Mixamo极简绑骨,导入unity中使用

如果你只想专注于角色建模,对于动画设计没有过多精力;如果你想白嫖别人的角色动画,用到自己的模型上;那么,这个网站很适合你:https://www.mixamo.com/ 操作步骤: 首先将自己的模型上传到这个网…

【kaggle数据集无法下载解决办法】

kaggle数据集无法下载的解决办法 当我们在做机器学习相关问题的时候,需要到kaggle网站上下载数据集,但是很多时候速度很慢或者连接超时等问题,此时解决办法如下: 在本地安装Kaggle API包 打开终端输入如下指令: pip i…

FL Studio 21.2.3官方中文版重磅发布,手把手教你图文安装

FL Studio 21.2.3官方中文版重磅发布纯正简体中文支持,更快捷的音频剪辑及素材管理器,多样主题随心换! 在数字音乐制作领域,FL Studio一直以其强大的功能和用户友好的界面而备受赞誉。随着技术的不断进步和音乐制作需求的日益增长…

Linux根目录挂载点(/dev/mapper/centos-root)扩容

如果我们在安装系统是采用自定义分区的话,就可以提前规划好这个事情。但是如果平常没注意就直接采用默认安装的方式的话。一旦 根目录的容量耗尽,将会影响业务的运行。今天我们来扩容逻辑卷。 默认安装的话会给home目录分比较多的空间,我们可…

python桌面应用

py文件 import osimport wx import wx.html2class MyFrame(wx.Frame):def __init__(self, parent):wx.Frame.__init__(self, parent, title"启动啦", size(1000, 700))# 创建一个Web视图组件self.browser wx.html2.WebView.New(self)# 加载本地HTML文件# self.brow…

常见硬件工程师面试题(二)

大家好,我是山羊君Goat。 对于硬件工程师,学习的东西主要和电路硬件相关,所以在硬件工程师的面试中,对于经验是十分看重的,像PCB设计,电路设计原理,模拟电路,数字电路等等相关的知识…

Web3 学习

之前学习 web3,走了不少弯路,最近看到了 hackquest,重新刷了一遍以太坊基础,感觉非常nice,而且完全免费,有需要的可以试试,链接hackquest.io。

Vue项目环境搭建及git仓库新建

不会安装的 可以找下博客,我会在另外一个博客 单独讲解git的安装 接下后启动对应的git bash文件,可以发送快捷方式到桌面 启动git命令的窗口 之后就可以在对应的文件下,启动git命令窗口了 3.码云-项目代码管理仓库 链接:https:…

充电桩---特斯拉NACS接口介绍

一、NACS接口发展 NACS是由特斯拉内部开发的,作为交流和直流充电的专有充电解决方案。2022年11月11日,特斯拉在官网上开放了自家的充电接口设计,并将特斯拉充电接口更名为NACS(North American Charging Standard)&…

数字货币与区块链生态

前言:区块链技术与数字货币这一文详细介绍了区块链技术,感兴趣的可以先看看这篇文章 1.比特币之后的数字货币与区块链发展 2.区块链形态 • 无许可区块链(permissionless blockchain) 用户无需许可即可加入区块链网络 • 许…

鸿蒙HarmonyOS服务卡片实战

引言 在现代开发中,服务卡片是不可或缺的一部分,比如音乐,天气类等应用,官网的介绍中写道:卡片让您便捷地预览服务信息,例如查看天气或日历日程等内容。您可将卡片添加到屏幕上,让这类信息触手…

【面试题】前端 移动端自适应?_前端移动端适配面试题

设备像素比 设备像素比 (DevicePixelRatio) 指的是设备物理像素和逻辑像素的比例 。比如 iPhone6 的 DPR 是2。 设备像素比 物理像素 / 逻辑像素。可通过 window.devicePixelRatio 获取,CSS 媒体查询代码如下 media (-webkit-min-device-pixel-ratio: 3), (min-…

初识 GPT-4 和 ChatGPT

文章目录 LLM 概述理解 Transformer 架构及其在 LLM 中的作用解密 GPT 模型的标记化和预测步骤 想象这样⼀个世界:在这个世界里,你可以像和朋友聊天⼀样快速地与计算机交互。那会是怎样的体验?你可以创造出什么样的应用程序?这正是…

【大数据】Hadoop学习笔记

基本概念 Hadoop组成 HDFS: Hadoop分布式文件存储系统, 在Haddop中处于底层/核心地位YARN: 分布式通用的集群资源管理系统和任务调度平台, 支撑各种计算引擎执行MapReduce: 第一代分布式计算引擎, 但因为部分原因, 许多企业都不直接使用MapReduce, 但许多底层软件仍然在使用Ma…

小程序wx.uploadFile异步问题

问题&#xff1a;小程序上传文件后我需要后端返回的一个值&#xff0c;但这个值总是在最后面导致需要这个值的方法总是报错&#xff0c;打印测试后发现这它是异步的。但直接使用 await来等待也不行。 uploadImg.wxml <view class"upload-wrap"><view clas…

2024北京智源大会开幕,智源推出大模型全家桶及全栈开源技术基座新版图,大模型先锋集结共探AGI之路

2024年6月14日&#xff0c;第六届“北京智源大会”在中关村展示中心开幕。 北京智源大会是智源研究院主办的“AI内行顶级盛会”&#xff0c;以“全球视野、思想碰撞、前沿引领”为特色&#xff0c;汇聚海内外研究者分享研究成果、探寻前沿知识、交流实践经验。2024北京智源大会…

自定义平台后台登录地址前缀的教程

修改平台后台地址默认的 admin 前缀 修改后端 config/admin.php 配置文件,为自定义的后缀修改 平台后台前端源码中 src/settings.js 文件,修改为和上面一样的配置修改后重新打包前端代码,并且覆盖到后端的 public 目录下重启 swoole 服务即可

Charles配置与API数据抓取

2024软件测试面试刷题&#xff0c;这个小程序&#xff08;永久刷题&#xff09;&#xff0c;靠它快速找到工作了&#xff01;&#xff08;刷题APP的天花板&#xff09;-CSDN博客跳槽涨薪的朋友们有福了&#xff0c;今天给大家推荐一个软件测试面试的刷题小程序。https://blog.c…

Crypto++ 入门

一、简介 Crypto&#xff08;也称为CryptoPP、libcrypto或cryptlib&#xff09;是一个免费的开源C库&#xff0c;提供了多种加密方案。它由Wei Dai开发和维护&#xff0c;广泛应用于需要强大加密安全的各种应用程序中。该库提供了广泛的加密算法和协议的实现&#xff0c;包括&…