2022 年 MathorCup 高校数学建模挑战赛——大数据竞赛(北京移动用户体验影响因素研究全套代码)

赛道 B:北京移动用户体验影响因素研究
     移动通信技术飞速发展,给人们带来了极大便利,人们也越来越离不开移动通信技术带来的各种便捷。随着网络不断的建设,网络覆盖越来越完善。各个移动运营商,越来越重视客户的网络使用体验,从而进一步提升网络服务质量。客户满意度是客户对运营商产品服务的满意程度,反映了客户期望与实际感知的产品服务之间的差异。特别是在信息透明、产品同质化的今天,客户满意度的表现成为各大运营商市场运营状况的重要体现。数字经济时代,各大运营商需要运用数字经济的管理理念和技术手段,建立客户体验生态的全方位系统性测评体系,实现客户满意度评测的数字化转型,让客户体验赋能商业决策,让商业决策真正服务客户,共同推动移动网络高质量可持续发展。
下面给出整体思路代码:

       首先对所有指标进行数据处理,进行缺失值和重复值检查。假设附件一和附件二的数据是对用户的真实情况记录,未对异常值进行处理。将object型数据进行编码处理,本文使用3种编码形式,包括lable编码、有序编码等。删除缺失值大于百分之 80的指标。考虑到变量的取值特征,本文将变量分为连续型变量和离散型变量两部分,分别运用相关分析和方差选择的方法,选择了与满意度在相关关系较强的20个连续型和26个离散型因素。对这50多个自变量与满意度建立LightGBM回归模型,并且对自变量的贡献度进行排序,找到前23个显著影响满意度的因素。考虑到这23个自变量之间可能存在多重共线性,为保证变量有较高的解释程度,计算自变量之间的相关系数,剔除自变量之间相关性较高的变量,最终得到对满意度最具显著影响的20个分子描述符变量。最后对选取的变量计算MIC和Spearman值,结果表明,选取的变量之间相关关系较弱,具有很好的独立性。同时,选取的20个变量具有很好的可解释性,说明20个变量的选取是合理的。

针对问题一(全套代码):
1、导入数据:
path1 = r"F:\mathorcup大数据出思路\2022年MathorCup大数据竞赛-赛道B初赛"
yuyin = pd.read_excel(path1+"/附件1语音业务用户满意度数据.xlsx")
inter = pd.read_excel(path1+"/附件2上网业务用户满意度数据.xlsx")

 

2、数据清洗(经过数据分析需要使用多种编码方式,包括lable编码、有序编码、计数编码):

#找到object列
types = pd.DataFrame(yuyin.dtypes).reset_index()
types[types[0]=='object']['index'].to_list()from tqdm import tqdm
for i in tqdm(['用户描述','用户描述.1','语音方式','客户星级标识']):enc=preprocessing.LabelEncoder()yuyin[i]=enc.fit_transform(yuyin[i])#训练LabelEncoder,将电脑,手表,手机编码为0,1,2biner = {'是':1,'否':0}
for i in tqdm(['是否关怀用户','是否去过营业厅','是否4G网络客户(本地剔除物联网)','是否5G网络客户','是否实名登记用户']):yuyin[i] = yuyin[i].map(biner)
mnso.matrix(yuyin_clear)
plt.show()nan_percent = 100*(df.isnull().sum()/len(df))# df.isnull().sum()统计每一列的缺失值数量# 再除上len()得到每一列的缺失值比例——小数形式# *100得到百分数nan_percent = nan_percent[nan_percent > 0].sort_values()# 得到每列的缺失值的占比,升序排序# >0是为了筛掉没有缺失值的列,只返回有缺失值的return nan_percent
print(missing_percent(yuyin_clear))

3、初步数据分析(单个变量与满意度分析) 

def get_random_color():r1 = lambda: random.randint(0,255)return '#%02X%02X%02X' % (r1(),r1(),r1())def get_histplot_central_tendency(df: dict, fields: list):for field in fields:f, (ax1) = plt.subplots(1, 1, figsize=(15, 5))v_dist_1 = df[field].valuessns.histplot(v_dist_1, ax=ax1, color=get_random_color(), kde=True)mean=df[field].mean()median=df[field].median()mode=df[field].mode().values[0]

 

def get_scatter(df: dict, fields: list):ylim = (0, 12)for field in fields:df_copy = pd.concat([df['语音通话整体满意度'], df[field]], axis=1)

 

def get_headmap(df: dict):corr = df.corr()plt.figure(figsize=(20, 20))

 

 4、因素分析

4.1 熵值法

from tqdm import tqdm 
for ye in tqdm([0,1]):df1 = df.interpolate()df333 = df.drop(['用户id','语音通话整体满意度'],axis=1)data = df333# 总指标数n = list(data.columns)# 最优指标,(x-min)/(max-min)# 最劣指标 (max-x)/(max-min)# 如果指标体系存在最优指标和最劣指标,采用下面的形式for i in n:# 获取各个指标的最大值和最小值Max = np.max(data[i])Min = np.min(data[i])data[i] = (Max - data[i])/(Max - Min)# 建立数据比重矩阵for i in n:# 计算指标总和Sum = np.sum(data[i])# 计算各地区某一指标占比data[i] = data[i]/Sum# 地区总数m = len(data)E = []# 计算信息熵值for i in n:K = 1/np.log(m)e = - K * np.sum(data[i] * np.log(data[i]))E.append(e)# 转换为数组形式E = np.array(E)

4.2 机器学习模型训练 

model_lgb = lgb.LGBMRegressor(objective='regression_l1',metric='mse',learning_rate=0.02,subsample = 0.8,colsample_bytree = 0.8,subsample_freq = 5,)

 4.3 计量模型(最小二乘)

# Coding method 2
import statsmodels.api as sm
# print the ols summary
x = sm.add_constant(train_x.fillna(0))

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/22749.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

2023年MathorCup数模C题赛题

C 题 电商物流网络包裹应急调运与结构优化问题 问题C,题目的设置就是本科生专科生选题,因此在题目难度上应该会和AB,有明显的区别。整个问题的设置还是很符合妈杯的风格设置,下面我们简要的看一下各个题目设置。 问题 1&#xff1…

【数模研赛】“华为杯”第十九届中国研究生数学建模竞赛C题分享——(四)问题二模型建立

写在前面: 第十九届数模研赛在22年10月6-10日开展,我和我的两名队友肝了5天,整出来一篇论文。因为不确定自己做的好不好,所以一直没写博客。前两天结果出来了,我们队拿了国二,在C题里排名88/1134&#xff0…

8月的数模比赛,适合小白为国赛热热身,可以报名了!

​经常有同学在交流群问:小白怎么入门?该从什么学起? 在入门指导的文章中曾讲过:实战是最好的学习。直接参赛,遇到不会的就去搜、去翻书,现学现用,多做几次比赛就入门了。 现在8月份的华数杯已…

2019-12-02 校内数模新手赛

调查地铁站的路径选择问题 摘要 对于一二线城市,地铁已成为民众不可或缺的出行方式,为了减少在上班上学路上消耗的时间,人们也可谓绞尽脑汁。这次,我们要帮助p同学,在他解决地铁"最佳门"问题时提供耗时最短…

2021年MathorCup高校数学建模挑战赛——大数据竞赛赛道A -思路分享

4.8号公布了复赛获奖名单,比赛正式告一段落,为什么现在才开始写呢?其实一是最近一直很忙,二是感觉自己做的不咋地,趁今天有空就写写吧,时间一长就又不想写了。 好了胡扯到此结束,言归正传&#…

第五届“传智杯”全国大学生计算机大赛(练习赛)传智杯 #5 练习赛] 平等的交易

[传智杯 #5 练习赛] 平等的交易 题目描述 你有 n n n 件道具可以买,其中第 i i i 件的价格为 a i a_i ai​。 你有 w w w 元钱。你仅能用钱购买其中的一件商道具。当然,你可以拿你手中的道具换取其他的道具,只是这些商道具的价值之和&…

数学建模相关比赛汇总(含各赛事官方网站链接)

前言 官网可以进行资料下载,历年的建模题等可在官网下载; 注册、报名、缴费、选题、显示论文收到与否、最新Summary论文模板的下载、查询获奖结果。 按含金量笔者分为四个梯队,如有不妥,请发私信联系楼主。 第一梯队:…

MathorCup高校数学建模挑战赛——大数据竞赛 赛道A 移动通信基站流量预测baseline

文章目录 前言一、简单分析二、具体程序1.引入库2.读入数据3.数据处理4.模型训练和预测5.结果文件输出 总结 前言 本文给出2020年MathorCup高校数学建模挑战赛——大数据竞赛中的赛道A移动通信基站流量预测的baseline,这个题目的具体描述和数据集请见链接。 整个程…

2022年第三届MathorCup高校数学建模挑战赛——大数据竞赛 赛道B 北京移动用户体验影响因素研究 问题一建模方案及代码实现详解

【BetterBench原创】2022年第三届MathorCup高校数学建模挑战赛——大数据竞赛 赛道B 北京移动用户体验影响因素研究 建模方案及代码实现(更新中) 更新进展 2022年12月21日 12:20 发布问题一、二思路及问题一的python代码实现 2022年12月22日 15:00 发…

鬼畜提问变身指南:ChatGPT十个打破常规的提问公式

Chatgpt的恐怖之处不在于它有多么的准确,很多时候它的回答甚至充满常识性错误,比如你问美国为什么轰炸珍珠岛它都能一本正经的回答你(这当然也有中文语料数据投喂不足和中文本身就复杂而难以理解的原因,听说用英文提问的准确性会提…

ChatGPT怎么用?30句提问公式,一定有你的行业能用到的一句

在使用ChatGPT过程中,总感觉用ChatGPT的效果没有那么好。经过多次使用和摸索,终于发现了问题,原来不是ChatGPT不好用,效果不好,而是因为我之前不会提问。 话不多说,给大家准备了30句ChatGPT提问公式&#…

pdfGPT|无需阅读,让 PDF 和自己对话

目前 ChatGPT 无法直接与外部数据进行交互。如果我们能将自己的数据投喂给它,并且让它根据数据与我们对话,那么我们就能将 ChatGPT 变成自己的知识库。这种方法将使 ChatGPT 更加智能化和可定制化,更好地满足用户的需求。 因 OpenAI gpt-3.5…

学生作业形同虚设!ChatGPT作弊成风!OpenAI:正在自研审核工具

本文来源 机器之心 编辑:泽南、蛋酱 「对学生有负面影响」,这么大责任 OpenAI 可担不起。 语言生成模型来了,学校的作业会不会从此变得形同虚设?近日,纽约市教育官员宣布禁止学生在公立学校使用 ChatGPT 的事件引发了…

聚观早报|马斯克将TruthGPT挑战ChatGPT;腾讯披露自研芯片新进展

今日要闻:马斯克将TruthGPT挑战ChatGPT;苹果在印度年销售额近60亿美元;腾讯披露自研芯片沧海最新进展;特斯拉中国工厂普通工人月薪约1万元;飞猪将直接向阿里CEO张勇汇报 马斯克将TruthGPT挑战ChatGPT 4 月 18 日消息&…

微信公众号(一)每日推送详细教程(含实时定位,天气预报,每日英语,纪念日等,可快速自定义消息模板并指定订阅者类型发送)

微信公众号(一)每日推送,天气推送 (含实时定位,天气预报,每日英语,纪念日等,可快速自定义消息模板并指定订阅者类型发送),另有小白网页版配置 版本介绍1. 相关…

《花雕学AI》用AI创造清晨的美好:ChatGPT+DALL-E 2 生成“早上好”的场景图

早晨是一天中最美好的时刻,也是最适合与AI对话的时刻。想象一下,当你醒来,打开手机,就能看到一个AI为你生成的“早上好”的场景图,是不是很温馨?这就是ChatGPTDALL-E 2(新Bing) 的魅…

我踩过的那些坑,浅谈一下如何更优雅地使用 Linux

前言 相信很多尝鲜过桌面 Linux 系统的朋友,对它一个很深刻的印象就是稳定性差:不知道怎么就把系统搞崩了,又找不到问题的具体原因和解决方法,只能尝试重装,直到心力交瘁地回到了 Windows 或 macOS。但另一方面&#…

李开复筹组 AI 2.0 全新平台,“零一万物”重磅上线!

「如同 Windows 带动了 PC 普及,Android 催生了移动互联网的生态,AI 2.0 将诞生比移动互联网大十倍的平台机会,将把既有的软件、使用界面和应用重写一次,也将诞生新一批 AI-first 的应用,并催生由 AI 主导的商业模式」…

AIGC领域最大收购:Databricks 13亿美元收购MosaicML,成立仅2年员工60人

Databricks CEO表示:“该交易旨在将企业数据与服务连接起来,帮助它们构建自己更便宜的语言模型。” 整理 | 梦依丹 出品 | CSDN(ID:CSDNnews) 大数据巨头 Databricks 宣布以 13 亿美元收购人工智能初创公司 MosaicML。…

2022年智源社区年度热点推荐丨新春集锦

本文为2022年最受智源社区小伙伴喜爱的文章,根据文章质量和热门程度等维度计算得出。还有AI大佬的全年总结盘点总结,也一并推荐给你。虎年除旧,兔年迎新,藉此机会、智源编辑组全员谨祝大家新春快乐! 2022 智源社区20篇…