高校学生消费行为分析系统

目 录
摘 要 I
ABSTRACT II
1 绪论 5
1.1选题背景及意义 5
1.2研究现状 5
1.2研究主要内容 5
2 系统相关技术介绍 7
2.1聚类算法 7
2.2 ECharts 7
2.3 Python 7
2.4 MySQL简介 8
3 系统分析 9
3.1 功能需求分析 9
3.2 业务流程分析 10
3.3 数据流图 14
3.4 数据库概念模型设计 17
4 系统设计 18
4.1 系统网络架构设计 18
4.2 系统总体设计 18
4.3 系统功能模块设计 19
4.4 程序系统的结构 21
4.5 大数据集群框架模块设计说明 21
4.5.1 程序描述 21
4.5.2 功能 21
4.5.3 算法 22
4.6 大数据处理模块设计说明 22
4.6.1 程序描述 22
4.6.2 功能 22
4.6.3 算法 23
4.7 数据可视化模块设计 23
4.7.1 程序描述 23
4.7.2 功能 23
4.7.3 算法 24
4.8 数据库设计 24
4.8.1 数据库表设计 24
4.8.2 数据库连接设计 25
5 系统实现 28
5.1 数据清洗的实现 28
5.2 数据库工具类编写实现 29
5.3导入IPUtils工具类对IP进行解析 30
5.4编写Dao层将数据解析并存储到数据库中 31
5.5 对各维度数据的统计并调用Dao入库 31
5.6 构建数据可视化项目 34
5.7 使用echarts进行数据可视化 36
6 总结 38
参考文献 39
致 谢 41
1 绪论
1.1选题背景及意义
当代大学生是未来社会建设的栋梁,过分追求时尚和名牌,存在攀比心理。为了拥有一款手机或换一款流行的手机,有的同学情愿节衣缩食,不惜牺牲其他必要开支;有些同学为了一件名牌衣服、名牌鞋帽,甚至向别人借钱以满足欲望。一些学生不懂得量入而出,受虚荣心的驱使极易形成无休止的攀比心理。人际交往消费过度,主要体现为通讯支出和恋爱支出[1-2]。
大多承认追求情感需要物质投入,经常难以理性把握适度消费的原则。经济独立意识较弱,理财观念淡薄。学生在学期间做兼职占比太低,真正渴望经济独立的同学太少,拿着父母的钱出去挥霍者居多。大学生盲目消费的行为,给了校园贷等非法平台可乘之机[3]。许多学生对自身还款能力高估,由此导致拆东墙补西墙,借新贷还旧贷的窘况愈演愈烈,而大学生校园贷的合同,会有很多的陷阱,手续费、滞纳金、利息等,学生无力偿还导致债台高筑,从而违约,网贷平台就采取公开裸照、威胁、恐吓、跟踪、骚扰等方式催债,这样会使大学生心理和身体恐惧、矛盾,造成心理创伤[4]。
引导大学生继续保持艰苦朴素、勤俭节约的消费观念,反对奢侈浪费、盲目攀比、过高消费等不良消费风气,加强大学生健康的消费观念的培养与塑造,在当前构建节约型社会的大环境下具有非常重要的意义[5]。
1.2研究现状
1.2研究主要内容
本次设计的高校学生消费行为分析系统可以很好的收集到原始数据,并且处理这些收集来的这些原始数据,把这些数据中有用的部分我们清洗提取处理,做成我们需要的大学生消费行为的这种指标信息,然后给我分析,也可以给后面做用户画像,为大学生做一个消费引导,树立正确的消费观,所以我的这个系统在当前这个时代是很有研究价值的。
该系统的架构组成为:

  1. 数据采集模块:主要负责各种用户信息数据的收集工作。
  2. 原始数据存储模块:主要负责把收集出来打大量数据储存到可以做分析的系统平台上。
  3. 原始数据清洗模块:主要负责原始数据的格式化清洗和查询出自己业务需要的数据格式。
  4. 可用数据存储模块:主要负责把清除出来的需要用的数据放到数据仓库中使之可以用hql进行查询分析,然后得出每个业务需要的不同数据指标。
  5. 数据分析展示模块:主要负责把分析出来的数据指标展示出来给人们分析这个网站的友好度,和他的完成度或者找出网站中出现了什么问题,来分析大学生消费行为的特征做出不同的策略。
    本文转载自:http://www.biyezuopin.vip/onews.asp?id=14113
import matplotlib.pyplot as plt
#解决中文乱码问题
plt.rcParams["font.sans-serif"] = 'SimHei'
#解决负号无法正常显示问题
plt.rcParams['axes.unicode_minus'] = False
import pandas as pd
import numpy as npdf = pd.read_csv('E:/泰迪云课堂/python数据分析实训/学生校园消费行为分析/result/task1_X.csv', encoding='gbk')
#选取消费数据
df1 = df.loc[df['Type'] == '消费']
df1["Dept"].value_counts()
#提取食堂
index=['第四食堂', '第一食堂','第二食堂','红太阳超市','第五食堂','第三食堂','好利来食品店','水电缴费处']
df2 = df1.loc[df1['Dept'].isin(index)]
#统计每人在各消费地点的刷卡频次,平均消费
df3 = df2.groupby(['CardNo','Dept']).agg({'Type':'count','Money':'mean'}).reset_index()#索引转为列
#转换地点为数值,文本数字化
from sklearn.preprocessing import LabelEncoder
df3['deptlabel'] = LabelEncoder().fit_transform(df3['Dept'].values)
df3.head(10)
#k值
def k_SSE(X,clusters):K = range(1,clusters+1)TSSE = []for k in K:SSE = []kmeans = KMeans(n_clusters = k)kmeans.fit(X)labels = kmeans.labels_centers = kmeans.cluster_centers_for label in set(labels):SSE.append(np.sum((X.loc[labels == label,]-centers[label,:])**2))TSSE.append(np.sum(SSE))plt.style.use('ggplot')plt.plot(K,TSSE,'b*-')plt.xlabel('簇的个数')plt.ylabel('簇内离差平方和之和')plt.savefig("E:/泰迪云课堂/python数据分析实训/学生校园消费行为分析/result/task3_X3.png")plt.show()X = df3.loc[:,['Type','Money','deptlabel']]
#调用函数
k_SSE(X,15)
# 均值-方差标准化
from sklearn.preprocessing import StandardScaler   #导入均值-方差规范化模块
X = df3.loc[:,['Type','Money','deptlabel']]
scaler = StandardScaler()#创建标准差标准化转换器
scaler.fit(X) #生成计算规则
dt = scaler.transform(X)  #数据转换,标准化数据#建立模型
from sklearn.cluster import KMeans  #导入聚类算法模块
kmeans = KMeans(n_clusters=3, max_iter = 100)   #构建K-Means聚类模型 分3类,聚类最大循环次数
kmeans.fit(dt)   #训练模型,开始聚类
fit_label = kmeans.labels_   #聚类结果标签
center = kmeans.cluster_centers_   #类的簇中心
Fs=pd.Series(fit_label,index=df3['CardNo'])
r1 = pd.Series(fit_label).value_counts()#统计各个类别的数目
r2 = pd.DataFrame(center)#找出聚类中心
r = pd.concat([r1,r2],axis = 1)#横向连接,得到聚类中心对应的类别下数目
r.columns = list(X.columns)+[u'类别数目']#重命名表头
#绘制模型聚类结果
y_pred =kmeans.fit_predict(dt)
x = [n[0] for n in dt]
y = [n[1] for n in dt]
plt.scatter(x,y,c=y_pred,marker='o')
plt.xlabel('刷卡')
plt.ylabel('消费')
plt.savefig("E:/泰迪云课堂/python数据分析实训/学生校园消费行为分析/result/task3_X4.png")
plt.show()

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/24675.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

自动驾驶数据之争,走向合规

报道数字经济 定义转型中国 撰文 | 泰伯网 编辑 | 鹿野 2015年12月,一辆百度无人车从京新高速到五环进行了最高时速达100公里的全自动行驶,将国内自动驾驶推向大众视野。 当自动驾驶产业随时间沉淀驶入商业落地的下半场,百度对这场自动驾驶…

Android Studio App开发中多线程的讲解与实现新闻轮播滚动实战(附源码 超详细必看)

运行有问题或需要源码请点赞关注收藏后评论区留言 ~~~ 一、分线程通过Handler操作界面 为了使App运行的更加流畅,多线程技术被广泛应用于App开发,由于Android规定只有主线程才能直接操作界面,因此分线程若想修改界面就要另想办法&#xff0c…

遇到老赖找催收公司靠谱吗?

转自:http://wenzhang.zhaizhuanzhuan.cn/Detail.aspx?id62B3DBAE-B4E1-F634-F56B-8D8B5F7D2AE0 老赖与催收公司貌似是相互制衡的存在,一个敢“赖”,一个敢要。当这两种极端的个体碰到一起之后,他们真的会相互制衡吗? 就拿身边的…

Android App网络通信中通过runOnUiThread快速操纵界面以及利用线程池Executor调度异步任务实战(附源码 简单易懂)

运行有问题或需要源码请点赞关注收藏后评论区留言私信~~~ 一、通过runOnUiThread快速操纵界面 因为Android规定分线程不能够直接操纵界面,所以它设计了处理程序工具,由处理程序负责在主线程和分线程之间传递数据,如果分线程想刷新界面&#…

记一次基于模板方法的设计开发过程

1、背景 本人做抵押贷金融系统开发,最近在开发过程中,遇到一个新的需求,公司和原第三方支付公司有一定的矛盾,造成支付能力支持不足,公司内部进行的新支付系统的搭建,所以需要将原支付功能对接到新支付功能…

2022 读书总结

2022 年主要阅读了文学类和理财类书籍,增加了几本杂项书籍,具体如下: 文史类 4 本 《软技能 2-软件开发者职业生涯指南》- 约翰.森梅兹《三体:黑暗森林》-刘慈欣《三体:死神永生》-刘慈欣《浪潮之巅》- 吴军理财类 7 本…

派森小镇(五)帮助

雾霭沉沉,水波澄碧。在一处悠远僻静的地方上有一个神奇的小镇,小镇的名字叫派森镇。小镇的前面有一条河,碧蓝的水映出小镇周围水墨画般朦胧的世界。 小镇上的人一出生就拥有特殊的技能,他们中的每一个人都是python的成员&#xff…

零基础 Amazon Web Services (AWS) 入门教程图文版(一)

现在小站唯一的流量都靠AWS这个关键词了,刚好要用AWS重新建站,所以从头开始记录一遍吧。 所谓零基础,就是你可以没有任何AWS使用经历,仍然能够按照教程操作下去。所谓图文版,就是建议手机用户在没有连Wifi的情况下尽量不要查看全文。图片一般都有大图,看不清的可以点击查…

Java岗大厂面试百日冲刺 - 日积月累,每日三题【Day22,linux内核视频教程

优秀问答摘自:https://ask.csdn.net/questions/1101634 两者的共同点: 都是用来协调多线程对共享对象、变量的访问 都是可重入锁,同一线程可以多次获得同一个锁 都保证了可见性和互斥性 两者的不同点: ReentrantLock 显示的获…

百万奖金悬赏大模型不擅长的任务!这 11 个任务模型越大,效果越差!

夕小瑶科技说 原创 作者 | 智商掉了一地、Python 去年咱们在介绍百万悬赏时提到,“海量资源砸出的大模型真的会一直那么香吗?”,目前来看,自打 ChatGPT 横空出世引领一众大模型开辟新的生活和工作方式以来,还是挺香的…

三本-安全岗-面经总结(多多面经)

三月之前都不知道暑期实习是什么东西,导致错过很多机会,3月末才迷迷糊糊的准备面试,信息差跟环境真的很重要,周边没一个投暑期实习的同学,学校也没有任何提醒,自己一个人摸爬滚投实习、准备、面试&#xff…

数据万象 | AIGC 存储内容安全解决方案

AIGC(人工智能生产内容) 已经成为与PGC(专业生产内容)、UGC(用户生产内容)并驾齐驱的内容生产方式。由于 AI 的特性,AIGC在创意、个性化、生产效率等方面具有独特的优势,这些优势可以…

没关系,前端还死不了

前言 网络上的任何事情都可以在《乌合之众》书中找到答案。大众言论没有理性,全是极端,要么封神,要么踩死。不少人喷前端,说前端已死?前端内卷?前端一个月800包吃住? 对此我想说,“…

Android程序员秋招就业你准备好了嘛?

前言 秋招即将到了,又到了一年一度的大型“程序猿就业典礼”。 从事IT行业那么多年,我自己也经历过,也见过很多求职路上的人生百态。 当初我也是从一个不知名的“打工人”,到如今成为了鹅厂的一员… 这其中经历了太多太多&…

又一AIGC独角兽!帮企业定制大模型,营销物料生成发布全包,Adobe前CTO创办

衡宇 发自 凹非寺量子位 | 公众号 QbitAI 全球范围内的投资者纷纷重金押注AI初创公司这事儿,已经越来越掩藏不住了! ——又一家AI初创公司刚刚长成独角兽,这距离其第一次公开露面只过去4个月时间。 最新消息,Adobe前CTO Abhay Par…

“意识机器”初探:如何让大语言模型具备自我意识?

导语 什么是意识?现在的大语言模型具备意识了吗?我们能否造出具备自我意识的机器?在集智俱乐部「后ChatGPT」读书会,北京师范大学系统科学学院教授、集智俱乐部创始人张江老师回顾了意识科学和意识建模领域的进展,认为…

【人工智能AI2.0】清华发布了 ChatGLM-6B 中国大模型5支学术界团队和10大产业界力量介绍

ChatGLM 简介 https://chatglm.cn/login 目录 ChatGLM 简介 ChatGLM 特点 ChatGLM 基于智谱 AI GLM-130B

从脑科学角度解析GPT4及人工智能

来源:图灵教育 本文内容整理自图灵社区直播《对谈 | 刘江 刘嘉:从脑科学 人工智能角度讲透 GPT-4》 刘嘉,清华大学基础科学讲席教授,清华大学心理学系系主任,清华大学脑与智能实验室首席研究员 未来是什么样子&#…

缠论指标缠论指标

点击领取:缠论指标 支持平台 01 通达信(电脑手机) 通达信版本简介 02 01 基础版功能: 支持缠论自动分笔,自动线段,显示笔中枢(蓝色),线段中枢(橙色)&am…

tushareAPI获取股票沪深指数

上证指数历史数据采集 ID:503658 代码 # # 导入tushare import tushare as ts # 初始化pro接口 pro ts.pro_api(你自己的TOKEN)# 拉取数据 df pro.index_daily(**{"ts_code": "000001.SH","trade_date": "","st…