【深度学习】实验03 特征处理

文章目录

  • 特征处理
    • 标准化
    • 归一化
    • 正则化

特征处理

标准化

# 导入标准化库
from sklearn.preprocessing import StandardScalerfrom matplotlib import gridspec
import numpy as np
import matplotlib.pyplot as plt
import warnings
warnings.filterwarnings("ignore")
# 随机生成0到100的整数,100行2列
data = np.random.randint(0, 100, (100, 2))
data

array([[ 7, 84],
[43, 81],
[22, 84],
[ 7, 61],
[51, 74],
[95, 94],
[80, 92],
[58, 35],
[88, 15],
[61, 42],
[75, 95],
[87, 64],
[18, 77],
[13, 60],
[18, 51],
[61, 12],
[32, 11],
[ 6, 77],
[85, 44],
[87, 10],
[84, 10],
[ 1, 28],
[76, 87],
[61, 0],
[ 9, 25],
[83, 75],
[ 7, 60],
[80, 73],
[62, 58],
[71, 84],
[78, 6],
[92, 54],
[92, 50],
[28, 57],
[73, 80],
[97, 86],
[84, 78],
[ 9, 29],
[90, 64],
[ 8, 32],
[98, 62],
[45, 93],
[73, 72],
[97, 11],
[21, 66],
[32, 9],
[65, 59],
[30, 36],
[19, 37],
[75, 43],
[90, 55],
[53, 8],
[73, 25],
[73, 82],
[84, 76],
[49, 97],
[29, 64],
[69, 37],
[72, 90],
[10, 87],
[19, 70],
[49, 53],
[56, 24],
[61, 16],
[58, 23],
[28, 31],
[37, 49],
[67, 25],
[31, 99],
[38, 84],
[55, 53],
[27, 89],
[83, 50],
[73, 86],
[67, 11],
[61, 72],
[17, 88],
[82, 67],
[56, 51],
[18, 59],
[73, 44],
[ 8, 86],
[ 6, 20],
[32, 12],
[15, 4],
[91, 17],
[21, 78],
[67, 63],
[12, 32],
[45, 76],
[41, 29],
[75, 64],
[75, 19],
[ 1, 76],
[17, 18],
[13, 47],
[80, 48],
[88, 76],
[29, 63],
[21, 95]])

# 标准化
ss = StandardScaler()
std_data = ss.fit_transform(data)
std_data

array([[-1.50234381, 1.09430096],
[-0.28120186, 0.98577525],
[-0.99353466, 1.09430096],
[-1.50234381, 0.26227048],
[-0.00983698, 0.73254858],
[ 1.48266985, 1.45605335],
[ 0.97386071, 1.38370287],
[ 0.22760729, -0.67828572],
[ 1.24522559, -1.40179049],
[ 0.32936912, -0.42505905],
[ 0.80425766, 1.49222858],
[ 1.21130498, 0.37079619],
[-1.1292171 , 0.84107429],
[-1.29882015, 0.22609524],
[-1.1292171 , -0.09948191],
[ 0.32936912, -1.5103162 ],
[-0.65432856, -1.54649144],
[-1.53626442, 0.84107429],
[ 1.14346376, -0.35270857],
[ 1.21130498, -1.58266668],
[ 1.10954315, -1.58266668],
[-1.70586747, -0.93151239],
[ 0.83817827, 1.20282668],
[ 0.32936912, -1.94441906],
[-1.43450259, -1.0400381 ],
[ 1.07562254, 0.76872382],
[-1.50234381, 0.22609524],
[ 0.97386071, 0.69637334],
[ 0.36328973, 0.15374476],
[ 0.66857522, 1.09430096],
[ 0.90601949, -1.72736763],
[ 1.38090802, 0.00904381],
[ 1.38090802, -0.13565714],
[-0.790011 , 0.11756952],
[ 0.73641644, 0.94960001],
[ 1.55051107, 1.16665144],
[ 1.10954315, 0.87724953],
[-1.43450259, -0.89533715],
[ 1.3130668 , 0.37079619],
[-1.4684232 , -0.78681143],
[ 1.58443168, 0.29844572],
[-0.21336064, 1.41987811],
[ 0.73641644, 0.6601981 ],
[ 1.55051107, -1.54649144],
[-1.02745527, 0.44314667],
[-0.65432856, -1.61884192],
[ 0.46505156, 0.18992 ],
[-0.72216978, -0.64211048],
[-1.09529649, -0.60593524],
[ 0.80425766, -0.38888381],
[ 1.3130668 , 0.04521905],
[ 0.05800424, -1.65501716],
[ 0.73641644, -1.0400381 ],
[ 0.73641644, 1.02195048],
[ 1.10954315, 0.80489905],
[-0.0776782 , 1.56457906],
[-0.75609039, 0.37079619],
[ 0.600734 , -0.60593524],
[ 0.70249583, 1.31135239],
[-1.40058198, 1.20282668],
[-1.09529649, 0.58784762],
[-0.0776782 , -0.02713143],
[ 0.15976607, -1.07621334],
[ 0.32936912, -1.36561525],
[ 0.22760729, -1.11238858],
[-0.790011 , -0.82298667],
[-0.48472551, -0.17183238],
[ 0.53289278, -1.0400381 ],
[-0.68824917, 1.63692954],
[-0.4508049 , 1.09430096],
[ 0.12584546, -0.02713143],
[-0.82393161, 1.27517715],
[ 1.07562254, -0.13565714],
[ 0.73641644, 1.16665144],
[ 0.53289278, -1.54649144],
[ 0.32936912, 0.6601981 ],
[-1.16313771, 1.23900191],
[ 1.04170193, 0.47932191],
[ 0.15976607, -0.09948191],
[-1.1292171 , 0.18992 ],
[ 0.73641644, -0.35270857],
[-1.4684232 , 1.16665144],
[-1.53626442, -1.2209143 ],
[-0.65432856, -1.5103162 ],
[-1.23097893, -1.79971811],
[ 1.34698741, -1.32944001],
[-1.02745527, 0.87724953],
[ 0.53289278, 0.33462096],
[-1.33274076, -0.78681143],
[-0.21336064, 0.80489905],
[-0.34904307, -0.89533715],
[ 0.80425766, 0.37079619],
[ 0.80425766, -1.25708953],
[-1.70586747, 0.80489905],
[-1.16313771, -1.29326477],
[-1.29882015, -0.24418286],
[ 0.97386071, -0.20800762],
[ 1.24522559, 0.80489905],
[-0.75609039, 0.33462096],
[-1.02745527, 1.49222858]])

# 作图
gs = gridspec.GridSpec(5,5)
fig = plt.figure()
ax1 = fig.add_subplot(gs[0:2, 1:4])
ax2 = fig.add_subplot(gs[3:5, 1:4])ax1.scatter(data[:, 0], data[:, 1])
ax2.scatter(std_data[:, 0], std_data[:, 1])plt.show()

1

归一化

# 导入归一化库
from sklearn.preprocessing import MinMaxScaler
import numpy as npdata = np.random.uniform(0, 100, 10)[:, np.newaxis]
mm = MinMaxScaler()
mm_data = mm.fit_transform(data)
origin_data = mm.inverse_transform(mm_data)
print('data is ',data)
print('after Min Max ',mm_data)
print('origin data is ',origin_data)

data is [[67.74476271]
[10.2077285 ]
[27.34037799]
[24.72236105]
[68.67245127]
[91.11026437]
[51.92345696]
[92.05191865]
[16.9495692 ]
[94.18851495]]
after Min Max [[0.6851214 ]
[0. ]
[0.20400678]
[0.17283278]
[0.69616784]
[0.96334578]
[0.49672943]
[0.97455851]
[0.08027837]
[1. ]]
origin data is [[67.74476271]
[10.2077285 ]
[27.34037799]
[24.72236105]
[68.67245127]
[91.11026437]
[51.92345696]
[92.05191865]
[16.9495692 ]
[94.18851495]]

正则化

# 导入L1正则化库
from sklearn.preprocessing import Normalizer# 导入L2正则化库
from sklearn.preprocessing import normalizeX = [[1, -1, 2],[2, 0, 0],[0, 1, -1]]normalizerl1 = Normalizer(norm='l1')
l1 = normalizerl1.fit_transform(X)
print('l1:', l1)l2 = normalize(X, norm='l2')
print('l2:', l2)
l1: [[ 0.25 -0.25  0.5 ][ 1.    0.    0.  ][ 0.    0.5  -0.5 ]]
l2: [[ 0.40824829 -0.40824829  0.81649658][ 1.          0.          0.        ][ 0.          0.70710678 -0.70710678]]

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/108767.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Tomcat 部署时 war 和 war exploded区别

在 Tomcat 调试部署的时候,我们通常会看到有下面 2 个选项。 是选择war还是war exploded 这里首先看一下他们两个的区别: war 模式:将WEB工程以包的形式上传到服务器 ;war exploded 模式:将WEB工程以当前文件夹的位置…

基于风险的漏洞管理

基于风险的漏洞管理涉及对即将被利用的漏洞的分类响应,如果被利用,可能会导致严重后果。本文详细介绍了确定漏洞优先级时要考虑的关键风险因素,以及确保基于风险的漏洞管理成功的其他注意事项。 什么是基于风险的漏洞管理对基于风险的漏洞管…

prometheus监控JVM(接入tomcat)

一、整合jmx_exporter及tomcat 1、 jmx_exporter下载地址 https://github.com/prometheus/jmx_exporter/releases 2、 tomcat配置文件下载地址 https://github.com/prometheus/jmx_exporter/blob/main/example_configs/tomcat.yml 3、创建tomcat_exporter目录 [rootlocalhost ~…

前端需要理解的性能优化知识

优化的目的是展示更快、交互响应快、页面无卡顿情况。 1 性能指标 2 分析方法 使用 ChromeDevTool 作为性能分析工具来观察页面性能情况。其中Network观察网络资源加载耗时及顺序,Performace观察页面渲染表现及JS执行情况,Lighthouse对网站进行整体评分…

【算法训练-双指针】最长无重复子串(数组)

废话不多说,喊一句号子鼓励自己:程序员永不失业,程序员走向架构!本篇Blog的主题是最长无重复子串或最长无重复子数组,这类题目出现频率还是很高的。 最长无重复子数组 先来看看数组数据结构的题目 题干 输入&#…

Android studio 软件git使用

在 test 分支添加的方法 , 现在切换到 master分支 总共 2 个分支 , 当前的分支是 test 出现了 先试一下 force checkout , 尝试之后发现 , 你更改没有带过来 , 以为哪个类在master分支没有 , 所以这边也没有 , 切回分支 test 发现之前的跟改没有 , 这样即可以找回 继续切换…

土豆叶病害识别(图像连续识别和视频识别)

效果视频:土豆叶病害识别(Python代码,pyTorch框架,视频识别)_哔哩哔哩_bilibili 代码运行要求:Torch库>1.13.1,其它库无版本要求 1..土豆叶数据集主要包好三种类别(Early_Blight…

Redis下载与安装

文章目录 Redis简介下载,安装和配置(cmd)图形化工具 Redis 简介 下载,安装和配置(cmd) 开启redis服务 1.在解压出来的文件夹中打开cmd 2.输入 redis-server.exe redis.windows.conf即可开启服务 可以看到…

用香港服务器域名需要备案吗?

​  在选择服务器的时候,很多人会考虑使用香港服务器。香港服务器的一个优势就是不需要备案。不管是虚拟主机还是云主机,无论是个人网站还是商业网站,都不需要进行备案手续。 域名实名认证 虽然不需要备案,但使用香港服务器搭建…

Jetpack Compose UI架构

Jetpack Compose UI架构 引言 Jetpack Compose是我职业生涯中最激动人心的事。它改变了我工作和问题思考的方式,引入了易用且灵活的工具,几乎可轻松实现各种功能。 早期在生产项目中尝试了Jetpack Compose后,我迅速着迷。尽管我已有使用Co…

【jvm】双亲委派机制

目录 一、说明二、工作原理三、优势四、图示 一、说明 1.java虚拟机对class文件采用的是按需加载的方式,当需要使用该类时才会将它的class文件加载到内存生成class对象 2.加载某个类的class文件时,java虚拟机采用双亲委派模式,即把请求交给由…

Spring Authorization Server入门 (十六) Spring Cloud Gateway对接认证服务

前言 之前虽然单独讲过Security Client和Resource Server的对接,但是都是基于Spring webmvc的,Gateway这种非阻塞式的网关是基于webflux的,对于集成Security相关内容略有不同,且涉及到代理其它微服务,所以会稍微比较麻…

怎么把pdf转换成jpg格式?

怎么把pdf转换成jpg格式?在我们日常的办公过程中,PDF文件是一个经常被使用来传输文件的格式。它能够确保我们的文件内容不会混乱,并以更加完美的方式呈现出来。然而,PDF文件也存在一些缺陷。例如,它无法直接编辑&#…

React+Typescript从请求数据到列表渲染

我们在项目src目录下创建一个目录 叫 pages 在里面创建一个组件叫 list.tsx 这里 我启动了自己的java项目 创建接口 你们就也需要弄几个自己的接口做测试 然后 list.tsx 编写代码如下 import * as React from "react";export default class hello extends React.C…

【seaweedfs】3、f4: Facebook’s Warm BLOB Storage System 分布式对象存储的冷热数据

论文地址 Facebook的照片、视频和其他需要可靠存储和快速访问的二进制大型对象(BLOB)的语料库非常庞大,而且还在继续增长。随着BLOB占用空间的增加,将它们存储在我们传统的存储系统-- Haystack 中变得越来越低效。为了提高我们的存储效率(以Blob的有效复…

基于安卓的考研助手系统app 微信小程序

,设计并开发实用、方便的应用程序具有重要的意义和良好的市场前景。HBuilder技术作为当前最流行的操作平台,自然也存在着大量的应用服务需求。 本课题研究的是基于HBuilder技术平台的安卓的考研助手APP,开发这款安卓的考研助手APP主要是为了…

计算机系统真题

计算机系统真题 考点计算机系统存储体系磁盘调度算法 考点 计算机系统 PC找到指令,存储到IR中 根据ID分析指令的操作,并执行指令,AR访问操作数 A pc存指令的地址 内存按照字节编址: 在统一单位,转换一下: 3x2的平方 …

Unix时间戳

江科大学习记录 Unix时间戳 Unix 时间戳(Unix Timestamp)定义为从UTC/GMT的1970年1月1日0时0分0秒开始所经过的秒数,不考虑闰秒时间戳存储在一个秒计数器中,秒计数器为32位/64位的整型变量世界上所有时区的秒计数器相同&#xf…

HTML番外篇(五)-移动端适配

一、媒体查询 1.认识媒体查询 媒体查询是一种提供给开发者针对不同设备需求进行定制化开发的一个接口。 你可以根据设备的类型(比如屏幕设备、打印机设备)或者特定的特性(比如屏幕的宽度)来修改你的页面。 媒体查询的使用方式主要有三种:…

算法笔记:球树

1 KD树的问题 算法笔记:KD树_UQI-LIUWJ的博客-CSDN博客 在kd树中,导致性能下降的最核心因素是因为kd-tree中被分割的子空间是一个个的超方体,而求最近邻时使用的是欧式距离(超球)。超方体与超球体相交的可能性是极高…