Python数据分析实战-依次遍历dataframe每一行，对某字段进行分析处理并新增一列（附源码和实现效果）

Python数据分析实战-依次遍历dataframe每一行，对某字段进行分析处理并新增一列（附源码和实现效果）

news/2025/1/11 15:00:04/文章来源:https://blog.csdn.net/sinat_41858359/article/details/132759186

实现功能

依次遍历每一行，在某列包含某个元素时新增一列进行标记

实现代码


def province_distribution_of_colleges(self, file):df = pd.read_excel(os.path.join(self.datapath, file))df1 = dfhua_bei = ['北京市','天津市','河北省','山西省','内蒙古自治区']dong_bei = ['辽宁省','吉林省','黑龙江省']hua_dong = ['上海市','江苏省','浙江省','安徽省','福建省','江西省','山东省']hua_nan = ['广东省','广西壮族自治区','海南省']zhong_nan = ['湖南省','湖北省','河南省','江西省']xi_nan = ['重庆市','四川省','贵州省','云南省','西藏自治区']xi_bei = ['陕西省','甘肃省','青海省','宁夏回族自治区','新疆维吾尔自治区']gang_ao = ['香港特别行政区','澳门特别行政区']df1['区域'] = Nonefor index, row in df1.iterrows():if row['省份'] in hua_bei:df1.at[index, '区域'] = '华北'elif row['省份'] in dong_bei:df1.at[index, '区域'] = '东北'elif row['省份'] in hua_dong:df1.at[index, '区域'] = '华东'elif row['省份'] in hua_nan:df1.at[index, '区域'] = '华南'elif row['省份'] in zhong_nan:df1.at[index, '区域'] = '中南'elif row['省份'] in xi_nan:df1.at[index, '区域'] = '西南'elif row['省份'] in xi_bei:df1.at[index, '区域'] = '西北'elif row['省份'] in gang_ao:df1.at[index, '区域'] = '港澳'else:df1.at[index, '区域'] = '未知'print(df1)province_distribution_of_colleges('schools_with_coordinates.xlsx')

实现效果

本人读研期间发表5篇SCI数据挖掘相关论文，现在某研究院从事数据挖掘相关科研工作，对数据挖掘有一定认知和理解，会结合自身科研实践经历不定期分享关于python机器学习、深度学习、数据挖掘基础知识与案例。

致力于只做原创，以最简单的方式理解和学习，关注我一起交流成长。

邀请三个朋友关注V订阅号：数据杂坛，即可在后台联系我获取相关数据集和源码，送有关数据分析、数据挖掘、机器学习、深度学习相关的电子书籍。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/125637.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

深入了解vue2没有在data中定义的属性非响应式的问题

深入了解vue2没有在data中定义的属性非响应式的问题

关于vue2没有在data中定义的属性非响应式的问题 vue2 响应式的原理及实现vue2 解决此类的部分 vue2 响应式的原理及实现 vue2 响应式数据是通过 es5 中的 Object.defineProperty 方法来实现，把 data 定义的所有属性，转换为 get/set 方法，使…

阅读更多...

如何使用HTTP代理爬虫,防止对网站造成负面影响

如何使用HTTP代理爬虫,防止对网站造成负面影响

在当今大数据时代，爬虫技术已经成为了获取数据的重要手段之一。但是，由于爬虫程序的高频访问容易对目标网站造成负面影响，如增加服务器负载、影响网站性能等，因此，如何使用HTTP代理爬虫防止对网站造成负面影响成为了一…

阅读更多...

2023-9-8 求组合数(一)

2023-9-8 求组合数(一)

题目链接：求组合数 I #include <iostream> #include <algorithm>using namespace std;const int mod 1e9 7;int n; const int N 2010; int c[N][N];void init() {for(int i 0; i < N; i )for(int j 0; j < i; j)if(!j) c[i][j] 1;else c[i]…

阅读更多...

Spring系列文章1：Spring入门程序

Spring系列文章1：Spring入门程序

一、什么是spring 一个java框架、java语言开发，轻量级、开源框架、在j2se、j2ee中都可以使用。它是一个管理对象的容器，Spring 容器不装文本，数字。装的是java对象。核心技术：ioc、aop 官网地址 https://spring.io 项目列表…

阅读更多...

聊聊低代码的全栈开发能力

聊聊低代码的全栈开发能力

一、前言低代码的热度持续提升，最明显的举动就是资本真金白银的投资。阿里推出“云钉一体”战略，为企业提供全生命周期的IT解决文案；腾讯将各个事业部的低代码平台进行整合，推出了OTeam平台。网易有数帆轻舟低代码平台&#xff…

阅读更多...

堆排序问题

堆排序问题

代码如下： //1.先将数组里的数字调整为大根堆（父节点均大于两个子节点）--由第一个非叶子节点开始 //第一个叶子节点是len/2,所以非叶子节点位len/2-1 //2.将根节点和最后一个结点进行交换，再将剩下的节点调整为大根堆&#xff0c…

阅读更多...

软件设计模式系列之一——设计模式概述

软件设计模式系列之一——设计模式概述

1 设计模式的由来和概念设计模式最早出现在建筑行业，是一位建筑领域的大牛，针对不同建筑物的建造方法进行了总结，针对类型相似的建筑场景，将较好的解决方案进行比较，提取了其中共性的套路规范，形成一定的设…

阅读更多...

【python爬虫】12.建立你的爬虫大军

【python爬虫】12.建立你的爬虫大军

文章目录前言协程是什么多协程的用法gevent库queue模块拓展复习复习前言照旧来回顾上一关的知识点！上一关我们学习如何将爬虫的结果发送邮件，和定时执行爬虫。关于邮件，它是这样一种流程： 我们要用到的模块是smtplib和emai…

阅读更多...

用Canape录制数据的操作方法

用Canape录制数据的操作方法

介绍本文档可帮助读者实现用canape上车录制所需数据的方法。一、打开ASAP2 Studio 软件，先对elf中的变量进行A2L转换 1、首先在电脑上插入canape盒子，打开你的ASAP2 Studio 软件，对elf中的变量进行A2L转换。 2、点击新建 New Database。 …

阅读更多...

基于大规模MIMO通信系统的半盲信道估计算法matlab性能仿真

基于大规模MIMO通信系统的半盲信道估计算法matlab性能仿真

目录 1.算法运行效果图预览 2.算法运行软件版本 3.部分核心程序 4.算法理论概述 5.算法完整程序工程 1.算法运行效果图预览 2.算法运行软件版本 matlab2022a 3.部分核心程序 %EM算法收敛所需的迭代 nIter 1; Yp Y(:,1:L_polit,:); %与导频序列相对应的部分 q…

阅读更多...

elementUI textarea可自适应文本高度的文本域

elementUI textarea可自适应文本高度的文本域

效果图; 通过设置 autosize 属性可以使得文本域的高度能够根据文本内容自动进行调整，并且 autosize 还可以设定为一个对象，指定最小行数和最大行数。 <el-inputtype"textarea"autosizeplaceholder"请输入内容"v-model"te…

阅读更多...

系统错误码指示确立+日志模块手动配置

系统错误码指示确立+日志模块手动配置

1，系统错误码指示确立对于前后端分离的系统设计中，后端建立错误码指示对于前端非常重要可以指示错误存在地方；以用户注册为例； public interface SystemCode{int SYSTEM_USER_ERROR_ADD_FAIL 10000;int SYSTEM_USER_INFO_ADD …

阅读更多...

OceanBase 4.x改装：另一种全链路追踪的尝试

OceanBase 4.x改装：另一种全链路追踪的尝试

本文作者：夏克 OceanBase 社区文档贡献者，曾多次参与 OceanBase 技术征文比赛，获得优秀名次。从事金融行业核心系统设计开发工作多年，服务于某交易所子公司，现阶段负责国产数据库调研。本文为 OceanBase 第七期技术征…

阅读更多...

CSS:实现文字溢出显示省略号且悬浮显示tooltip完整信息

CSS:实现文字溢出显示省略号且悬浮显示tooltip完整信息

组件： element ui中的tooltip组件思路：通过ref获取宽度进行判断，当子级宽度大于对应标签/父级宽度显示tooltip组件 <div class"bechmark-wrap"><ul ref"bechmarkUl"><liv-for"(item,index) in comp…

阅读更多...

typecho 反序列化漏洞复现

typecho 反序列化漏洞复现

环境搭建下载typecho14.10.10 https://github.com/typecho/typecho/tags 安装，这里需要安装数据库 PHPINFO POC.php <?php class Typecho_Feed { const RSS1 RSS 1.0; const RSS2 RSS 2.0; const ATOM1 ATOM 1.0; const DATE_RFC822 r; const DATE_W3…

阅读更多...

S32K324芯片学习笔记

S32K324芯片学习笔记

文章目录 Core and architectureDMASystem and power managementMemory and memory interfacesClocksSecurity and integrity安全与完整性Safety ISO26262Analog、Timers功能框图内存mapflash Signal MultiplexingPort和MSCR寄存器的mapping Core and architecture 两个Arm Co…

阅读更多...

【web开发】4.JavaScript与jQuery

【web开发】4.JavaScript与jQuery

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录一、JavaScript与jQuery二、JavaScript常用的基本功能1.插入位置2.注释3.变量4.数组5.滚动字符三、jQuery常用的基本功能1.引入jQuery2.寻找标签3.val、text、appe…

阅读更多...

超全60000多字详解 14 种设计模式 (多图+代码+总结+Demo)

超全60000多字详解 14 种设计模式 (多图+代码+总结+Demo)

超全60000多字详解 14 种设计模式 (多图代码总结Demo) 之前读耗子叔文章时，看到过有句话没有实践，再多的理论都是扯淡，个人很赞同。你觉得自己学会了，但实践与学会之间有着很大差别。单例模式 (Singleton Pattern) 定义或概念 …

阅读更多...

计算机重点学科评级B-，山东省属重点高校考情分析

计算机重点学科评级B-，山东省属重点高校考情分析

山东科技大学(B-) 考研难度（☆☆） 内容：23考情概况（拟录取和复试分析）、院校概况、23专业目录、23复试详情、各专业考情分析、各科目考情分析。正文1175字预计阅读：3分钟 2023考情概况山东科技大学计…

阅读更多...

php常用算法

php常用算法

许多人都说算法是程序的核心，一个程序的好于差,关键是这个程序算法的优劣。作为一个初级phper，虽然很少接触到算法方面的东西。但是对于冒泡排序，插入排序，选择排序，快速排序四种基本算法，我想还是要掌握…

阅读更多...

最新文章

推荐文章