基于python的电商运动服饰销售分析与预测系统

温馨提示:文末有 CSDN 平台官方提供的学长 Wechat / QQ 名片 :)

1. 项目背景

        随着电⼦商务的蓬勃发展,⽹络服装销售已经逐渐成为消费者最为青睐的廉价购物渠道。本项目基于python网络爬虫从某电商平台抓取所有运动服饰的销售数据,分析不同品牌运动服装价格分布、主流品牌运动服装销售占比、不同标签的运动服装销售占比、男女款式运动服装销售占比等信息,多维度对比各类服装价格的高低。并利用 TensorFlow 构建深度学习模型,实现对运动服饰销售价格的建模和预测。

2. 功能组成

        基于python的电商运动服饰销售分析与预测系统的功能主要包括:

 3. 电商运动服饰销售数据爬虫

        利用 request + beautifulsoup 等工具,抓取某电商平台的运动服饰栏目的在售商品及店铺等信息:

options = Options()
options.add_argument('--headless')
options.add_argument('--disable-gpu')
chrome_driver = 'path to chromedriver'
browser = webdriver.Chrome(chrome_options=options, executable_path=chrome_driver)base_url = 'https://list.xxxxx.com/list.html?cat=1318,12102,9765&page={}&sort=sort_rank_asc&trans=1&JL=6_0_0#J_main'file_out = open('sports_wears.json', 'w', encoding='utf8')
page = 1
while page < 262:url = base_url.format(page)print('--> 抓取 {} 页:{}'.format(page, url))browser.get(url)soup = BeautifulSoup(browser.page_source, 'lxml')items = soup.find_all('li', class_='gl-item')item_infos = []for item in items:item_info = {}# 服装价格price = item.find('div', class_='p-price').i.text.strip()# 服装名称name = item.find('div', class_='p-name').a.em.text.strip()# 评论人数......# 店铺名称......item_info['comment'] = commentitem_info['shop'] = shopitem_info['tags'] = tagsprint(json.dumps(item_info, ensure_ascii=False))item_infos.append(json.dumps(item_info, ensure_ascii=False) + '\n')page += 1# 保存数据file_out.writelines(item_infos)file_out.flush()time.sleep(1.1)
browser.close()

4. 电商运动服饰销售分析与预测系统

4.1 店铺销售情况查询

        使用选择框进行店铺的选择,查询当前各店铺在售运动服装的数据,包括:服装名称、店铺名称、标签、大小型号、评论个数、价格(元):

4.2 运动服装价格分布及影响因素分析

        为了更好的统计在售运动服装价格分布和大小型号之间的关系,设定了三类图,不同型号的运动服装在售件数(扇形图)、不同大小型号的运动服装的均价分布(条形图)、电商在售运动服装价格分布情况(散点图):

         各种型号的运动服装在售件数都显示在了扇形图对应的区域中,当鼠标悬浮在相应的位置时,便会显示该型号的在售个数和占比信息,如图中显示M型号的在售个数为3901,占比25.2%。在第二张图中,显示了不同大小型号的运动服装的均价分布,当鼠标悬浮在相应的位置时,便会显示该型号的均价信息,如途中显示的SS均价在559.00元。可以看出,在0-500之间的是最多的。同时由于散点过于密集,在此图的右上角具备区域缩放、区域缩放还原、还原、下载的功能。通过图表,可以很清晰的看到在售运动服装价格分布与大小型号之间关系。

 4.3 主流品牌运动服装销售占比

        不同品牌的运动服饰,其销售价格、在售数量不同,也反应了品牌的受欢迎程度,对不同品牌运动服装销售占比就行统计分析:

 4.4 不同标签的运动服装销售占比

        对新品、放心购、闪购、赠、门店有售、厂商配送、物流、险、自营、满减、满赠等不同标签的商品就行统计分析:

4.5 男女款式运动服装销售占比

        分析性别对运动服饰销售的影响程度,对齐销售占比就行统计分析:

 4.6 基于神经网络的运动服装价格预测

        利用商品的描述文本和标签等信息,预测商品的销售价格。基于 keras 或 TensorFlow 构建双向 GRU+Dense 的神经网络模型,利用抓取的运动服装数据进行模型的训练和验证:

# 构造双向 GRU + Dense 神经网络模型
def build_model():inp = Input(shape=(maxlen,))x = Embedding(max_features, embed_size)(inp)x = Bidirectional(GRU(64, return_sequences=True))(x)x = GlobalMaxPool1D()(x)x = Dense(16, activation="relu")(x)x = Dropout(0.1)(x)x = Dense(len(all_price_levels_map), activation="softmax")(x)model = Model(inputs=inp, outputs=x)model.compile(loss='categorical_crossentropy', optimizer='adam', metrics=['accuracy'])return model

        模型结构如下: 

        并对商品的描述文本进行中文分词和词性标注:

# 词性标注算法
from jieba.analyse.tfidf import TFIDFclass WordSegmentPOSKeywordExtractor(TFIDF):def extract_sentence(self, sentence):......seg_words = []pos_words = []for w in words:wc = w.wordseg_words.append(wc)pos_words.append(w.flag)if len(wc.strip()) < 2 or wc.lower() in self.stop_words:continuefreq[wc] = freq.get(wc, 0.0) + 1.0return seg_words, pos_wordsextractor = WordSegmentPOSKeywordExtractor()

5. 结论

        本项目基于python网络爬虫从某电商平台抓取所有运动服饰的销售数据,分析不同品牌运动服装价格分布、主流品牌运动服装销售占比、不同标签的运动服装销售占比、男女款式运动服装销售占比等信息,多维度对比各类服装价格的高低。并利用 TensorFlow 构建深度学习模型,实现对运动服饰销售价格的建模和预测。

欢迎大家点赞、收藏、关注、评论啦 ,由于篇幅有限,只展示了部分核心代码

技术交流认准下方 CSDN 官方提供的学长 Wechat / QQ 名片 :)

精彩专栏推荐订阅:

1. Python 毕设精品实战案例
2. 自然语言处理 NLP 精品实战案例
3. 计算机视觉 CV 精品实战案例

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/56027.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

宝宝看的启蒙动画片哪里找?三款电视软件推荐,孩子启蒙不怕难

家里宝宝已经2岁2个月&#xff0c;最近开始让她慢慢学着自己刷牙&#xff0c;刚开始那几天还很乐意&#xff0c;但是现在越来越抗拒刷牙了……周末带她去朋友家玩了一天&#xff0c;回来居然主动说晚上要刷牙才睡觉&#xff0c;我震惊了&#xff0c;一问她才知道&#xff0c;原…

Locust性能测试入门案例及分布式压测

前言 大家好&#xff0c;我是洋子。最近好多身边人都阳了&#xff0c;记得保护好自己 性能测试已经成为作为测试工程师/测试开发工程师一项重要的专项能力 在抢红包、活动秒杀这种短时间内流量突增的场景&#xff0c;或者是健康宝这种使用用户超级多的场景&#xff0c;我们均…

【笔记】Hawkes Process:超详细带示例的讲解

最近准备学Hawkes Process&#xff0c; 但是找遍了百度&#xff0c;b站&#xff0c;谷歌和youtube&#xff0c;都没有找到通俗易懂的讲解。今天终于在拆老师&#xff08;ChatGPT&#xff09;的帮助下搞懂了&#xff01;关于使用ChatGPT进行自学的Prompt可以看之前的笔记&#x…

用月壤实现太阳能发电,人类离「定居月球」又近一步 | 来自贝索斯蓝色起源...

Alex 发自 凹非寺量子位 | 公众号 QbitAI 用月球表面土壤搞太阳能发电&#xff1f;&#xff01; 你没听错&#xff0c;有人用这种材料做出了太阳能电池&#xff0c;人类朝“在月亮上搞基建”又前进一步。 这个“幕后使者”&#xff0c;既非马斯克的SpaceX&#xff0c;也非NASA&…

python调用oepnai API

目录 apiAI官网介绍&#xff08;[Introduction](https://platform.openai.com/docs/api-reference/introduction)&#xff09;安装官方SDK认证&#xff08;Authentication&#xff09;申请API KEY请求组织&#xff08;Requesting organization&#xff09; 发送请求关于chat to…

在线作图|2分钟在线绘制三维PCOA图

三维PCoA PCoA(Principal Co-ordinates Analysis)分析即主坐标分析&#xff0c;可呈现研究数据相似性或差异性的可视化坐标&#xff0c;是一种非约束性的数据降维分析方法&#xff0c;可用来研究样本群落组成的相似性或相异性。它与PCA类似&#xff0c;通过一系列的特征值和特…

python绘制3D图表

pyecharts绘制3D图表 参数配置和说明 Grid3DOpts、Axis3DOpts为3D图标需要配置项 Grid3DOpts&#xff1a;三位坐标系配置项 class pyecharts.options.Grid3DOpts class Grid3DOpts(# 三维笛卡尔坐标系组件在三维场景中的宽度width: Numeric 200,# 三维笛卡尔坐标系组件在三维…

在线作图|2分钟在线绘制三维CCA图

​三维CCA 典型相关分析&#xff08;Canonical Correlation Analysis&#xff09;是研究两组变量之间相关关系的一种多元统计方法&#xff0c;它能够揭示出两组变量之间的内在联系。冗余分析&#xff08;redundancy analysis, RDA&#xff09;或者典范对应分析&#xff08;can…

在线作图|2分钟绘制三维PCA图

三维PCA 主成分分析算法&#xff08;PCA&#xff09;是最常用的线性降维方法。PCA降维为了在尽量保证“信息量不丢失”的情况下&#xff0c;对原始特征进行降维&#xff0c;也就是尽可能将原始特征往具有最大投影信息量的维度上进行投影。将原特征投影到这些维度上&#xff0c…

Tikz 作图教程:pgfplots 宏包三维数据的可视化绘图

前一篇推文讲解了使用pgfplots 宏包导入二维数据和可视化绘图的方法。今天我们来介绍一下科研工作者常常用到的三维数据的导入与绘图的方法。 当一个函数关系式中出现了两个自变量时&#xff0c;我们需要用空间曲面来呈现其图像。 编辑之谈(知名origin 绘图公众号)最近一篇推…

plotly绘制3D图技巧

简介 Plotly 是一个非常强大的开源数据可视化框架&#xff0c;它通过构建基于 HTML 的交互式图表来显示信息&#xff0c;可创建各种形式的精美图表。本文所说的 Plotly 指的是 Plotly.js 的 Python 封装&#xff0c;plotly本身是个生态非常复杂的绘图工具&#xff0c;它对很多…

使用VoceChat 为自己的网站和社群搭建聊天机器人

使用VoceChat搭建一个自己的机器人 最近想要把AnyGPT的社群做起来&#xff0c;但是微信群的效率实在太低了&#xff0c;很多公共的问题会一遍又一遍的回答。还有就是&#xff0c;一直想在群里用GPT搭个机器人&#xff0c;但是在微信里面搭建机器人本身是不合法的&#xff0c;有…

学习Python可以做哪些副业,不看错过了一个亿,普通人可复制的暴利副业攻略

人生苦短&#xff0c;我用Python。 近年来&#xff0c;Python凭借其简洁易入门的特点受到越来越多人群的青睐。 当然这不仅仅是针对程序员来说&#xff0c;对于一些学生、职场人士也是如此。 Python为什么会大受欢迎呢&#xff1f;因为Python还被大家称为“胶水语言”&#…

ai帮你写论文,一款特别牛逼的ai对话网站

open ai 一、 open Ai 介绍二、 chat apt 演示三、 网址 一、 open Ai 介绍 OpenAI&#xff0c;在美国成立的人工智能研究公司。 公司核心宗旨在于“实现安全的通用人工智能(AGI)”&#xff0c;使其有益于人类。 chatapt超级对话模型 这一模型可以与人类进行谈话般的交互&…

ChatGLM实现本地部署类似GPT,训练自己的数据

ChatGPT最近火的不得了&#xff0c;但是注册账号&#xff0c;升级Plus非常麻烦&#xff0c;而且还要担心数据泄露&#xff0c;清华开源ChatGLM&#xff0c;实现本地部署&#xff0c;这就方便多了&#xff0c;不用魔法&#xff0c;就能本地访问&#xff0c;还可以喂一下自己行业…

如何选择一家靠谱的IT培训机构?

如何选择一家靠谱的IT培训机构&#xff1f;现在很多的人都知道工作很难找&#xff0c;如果没有一技之长就很难获取好的发展&#xff0c;如今互联网的发展前景广阔&#xff0c;很多人转型开始学习软件开发之类的技术&#xff0c;市场上的培训机构多入牛毛&#xff0c;那如何选择…

计算机培训班哪家靠谱?怎么选择

课程体系 选择一个适合自己的课程体系是最为重要的&#xff0c;课程体系的选择要考虑到自己的兴趣爱好&#xff0c;还有未来职业规划。就目前来说&#xff0c;很多人选择的目前比较好就业的课程&#xff0c;但是自己却完全没有兴趣。在这种情况下&#xff0c;人们很容易在未来…

我不是培训班的,但建议上IT培训班

目录 一、个人经历 二、有哪些IT培训班 三、学习IT上培训班的益处 四、学习IT上培训班的风险 五、就业前景 六、题外话 在学习IT技术的过程中&#xff0c;你是否也被安利过各种五花八门的技术培训班&#xff1f;这些培训班都是怎样向你宣传的&#xff0c;你又对此抱有着…

网上在线培训平台哪家好?

在21世纪的今天&#xff0c;“终身学习”已经不再是一个新颖的概念了&#xff0c;并且随着科技的进步&#xff0c;学习方式发生了变革&#xff0c;越来越多的人开始通过互联网学习知识。 网上在线学习平台的前景分析 随着科技水平的不断提升&#xff0c;在线学习saas管理系统…