随机分类,保持均衡水平Python

1、目的:
10000个样本有4个指标,按照逾期金额分10类,确保每类别逾期金额均衡。
2、数据:

3、思路:
将10000个样本按照逾期金额排序,
等距分箱为2500个类别
增加一列随机数
根据类别和随机数升序排列
增加一列赋值
按照分类的逾期金额求随机数

以下为10000个样本有4个指标,按照逾期金额分10类的代码逻辑。
4、代码实现
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from pandas import Series,DataFrame as df
import random

#1)获取数据
file_data= pd.read_csv(“D:\data\paixu.csv”)
file_data.shape
file_data.head()

#1)逾期金额升序排序
file_data1=file_data.sort_values(by=[‘yqje’],ascending=[True])

#2)等距分箱形成aa列
file_data1[‘aa’]=pd.cut(file_data1.yqje,2500,labels=range(0,2500))

#3)赋值一列bb为随机数
random_nums=np.random.randint(0,10000,size=10000)
file_data1[‘bb’]=random_nums

#4)根据aa 和bb列排序
file_data1=file_data1.sort_values(by=[‘aa’,‘bb’],ascending=[True,False])

#5)按照排序规则赋值1 2 3 4
values=[1,2,3,4,5,6,7,8,9,10]
new_col = [values[i % len(values)] for i in range(len(file_data1))]
file_data1[‘cc’]=new_col

#6)结论、
group_mean=file_data1.groupby(‘cc’)[‘yqje’].mean()

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/422733.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Linux学习-Docker文件系统

Overlayfs Overlayfs 是一种类似 aufs 的一种堆叠文件系统,于 2014 年正式合入 Linux-3.18 主线内核,目前其功能已经基本稳定(虽然还存在一些特性尚未实现)且被逐渐推广。 Overlayfs 是一种堆叠文件系统,它依赖并建立…

在VB.net中,DateTime类使用,举例说明

标题 在VB.net中,DateTime类使用,举例说明 前面学习相关 1.在VB.net中,如何把"20240906"转化成日期格式 2.在VB.net中 DateTime有什么属性与方法 3.在VB.net中,Stopwatch有什么属性与方法 正文 在VB.NET中,D…

利用 Zero-1-2-3 进行多视图 3D 重建:从单图像到多视图 3D 模型的生成

3D 模型生成在计算机视觉领域有着广泛的应用,从虚拟现实到自动驾驶,基于单张图像的 3D 重建技术正在迅速发展。这篇博客将带你深入探索如何使用 Zero-1-2-3 框架进行多视图 3D 重建,通过详细解析该框架中的代码结构和功能,帮助你理…

【ArcGIS Pro实操第七期】栅格数据合并、裁剪及统计:以全球不透水面积为例

【ArcGIS Pro实操第七期】批量裁剪:以全球不透水面积为例 准备:数据下载ArcGIS Pro批量裁剪数据集1 数据拼接2 数据裁剪3 数据统计:各栅格取值3.1 栅格计算器-精确提取-栅格数据特定值3.2 数据统计 4 不透水面积变化分析 参考 准备&#xff1…

python学习第八节:爬虫的初级理解

python学习第八节:爬虫的初级理解 爬虫说明:爬虫准备工作:分析网站url分析网页内容 爬虫获取数据:1.使用urllib库发起一个get请求2.使用urllib库发起一个post请求3.网页超时处理4.简单反爬虫绕过5.获取响应参数6.完整请求代码 解析…

STM32——玩转超声波传感器

目录 1.什么是超声波? 超声波的基本特点: 2.超声波传感器介绍:HC-SR04 HC-SR04 主要特点: HC-SR04 接线如下: HC-SR04 工作原理: 如何编写超声波测距代码? 编写逻辑: 编写思…

JavaWeb项目打包、部署至Tomcat并启动的全程指南(图文详解)

前言 我们想要部署一个javaWeb项目到tomcat上,需要了解一些概念 什么是tomcat? Tomcat 是 Apache 软件基金会(Apache Software Foundation)下的一个开源项目,主要用于实现 Java Servlet、JavaServer Pages(…

SpinalHDL之数据类型(六)

本文作为SpinalHDL学习笔记第五十九篇,介绍SpinalHDL的Vec数据类型。 目录: 1.描述(Description) 2.声明(Declaration) 3.操作符(Operators) ⼀、描述(Description) Vec是定义了⼀组带有标号的信号的复合信号(基于SpinalHDL基础类别)。 ⼆、声明(Declaration) 声明向量的…

远程桌面内网穿透是什么?有什么作用?

远程桌面内网穿透指的是通过特定技术手段,将处于内网中的电脑或服务器,通过外部网络(互联网)进行访问。内网穿透的主要作用是解决在内网环境下,远程设备与外部互联网之间的连接问题,允许用户从外部访问内网…

Docker部署tenine实现后端应用的高可用与负载均衡

采用Docker方式的Tengine 和 keepalived 组合模式可以实现小应用场景的高可用负载均衡需求 目录 网络架构一、环境准备二、软件安装1. 下载Tenine镜像2. 下载Keepalived镜像3. 制作SpringBoot镜像 三、软件配置1. 创建应用容器2. 代理访问应用3. 创建Keepalived4. 测试高可用 网…

【计算机网络】UDP 协议详解及其网络编程应用

文章目录 一、引言二、UDP1、UDP的协议格式2、UDP 报文的解包和分用3、UDP面向数据报的特点 三、UDP输入输出四、UDP网络编程 一、引言 UDP(User Datagram Protocol,用户数据报协议)是一种网络通信协议,它属于传输层的协议。是一…

【Qt】子控件选择器

子控件选择器 有些控件内部包含了多个 "⼦控件" . ⽐如 QComboBox 的下拉后的⾯板, ⽐如 QSpinBox 的上下按钮等。 可以通过⼦控件选择器 :: , 针对上述⼦控件进⾏样式设置. 参考⽂档 Qt Style Sheets Reference 中 List of Sub-Controls 例子:设置下拉…

智慧交通:关键技术及应用场景

智慧交通是指通过信息和通信技术,对交通系统进行全面感知、高效管理和智能控制的一种交通管理模式。随着城市化进程的加速和交通需求的增长,智慧交通技术应运而生,为实现交通安全、高效、环保等目标提供了新的途径。 1. 关键技术 物联网技术…

Leetcode Hot 100刷题记录 -Day15(螺旋矩阵)

螺旋矩阵 问题描述: 给你一个 m 行 n 列的矩阵 matrix ,请按照 顺时针螺旋顺序 ,返回矩阵中的所有元素。 示例 1: 输入:matrix [[1,2,3],[4,5,6],[7,8,9]]输出:[1,2,3,6,9,8,7,4,5] 示例 2: 输…

Docker数据挂载本地目录

docker内的数据映射可以不通过数据卷,直接映射到本地的目录。下面将以mysql容器示例,完成容器的数据映射。 注意:每一个不同的镜像,将来创建容器后内部有哪些目录可以挂载,可以参考DockerHubDocker Hub Container Ima…

07 vue3之组件及生命周期

组件基础 每一个.vue 文件呢都可以充当组件来使用 每一个组件都可以复用 组件的生命周期 简单来说就是一个组件从创建 到 销毁的 过程 成为生命周期 在我们使用Vue3 组合式API 是没有 beforeCreate 和 created 这两个生命周期的 onBeforeMount() 在组件DOM实际渲染安装之前…

跑DecoupleSegNets遇到的问题

论文:[ECCV-2020]: Improving Semantic Segmentation via Decoupled Body and Edge Supervision 代码:https://github.com/lxtGH/DecoupleSegNets 不想用 ./scripts/train/train_cityscapes_ResNet50_deeplab.sh,直接改train.py 原来citisca…

常量指针、指针常量及常量指针常量

目录 1. 常量指针(Pointer to Constant) 2. 指针常量(Constant Pointer) 3. 常量指针常量(Constant Pointer to Constant) 常量指针:指针指向的值不能改,但指针本身可以指向其他地…

Java+selenium+chrome+linux/windows实现数据获取

背景:在进行业务数据获取或者自动化测试时,通常会使用模拟chrome方式启动页面,然后获取页面的数据。在本地可以使用windows的chromedriver.exe进行打开chrome页面、点击等操作。在linux 下通常使用无界面无弹窗的方式进行操作。接下来是实现方…

IP网络广播服务平台任意文件上传漏洞

文章目录 免责声明搜索语法漏洞描述漏洞复现修复建议 免责声明 本文章仅供学习与交流,请勿用于非法用途,均由使用者本人负责,文章作者不为此承担任何责任 搜索语法 icon_hash"-568806419"漏洞描述 该系统在upload接口处可上传任…