一、项目背景
-
网上购物已经成为大众生活的重要组成部分。人们在电商平台上浏览商品并购物,产生了海量的用户行为数据,用户对商品的详情数据对商家具有重要的意义。利用好这些碎片化、非结构化的数据,将有利于企业在电商平台上的持续发展,同时,对这部分数据进行分析,依据评论数据来优化现有产品也是大数据在企业经营中的实际应用。
-
分析产品:韶音 AfterShokz Aeropex AS800骨传导蓝牙耳机运动无线耳骨传导耳机跑步骑行 环法特别版(Aeropex AS800是AfterShokz韶音的网红新品,很多国内外的跑者都在使用,在Instagram上也有很高的热度。)
-
分析平台:京东
-
数据获取量:由于京东对评论的设置只显示前100页数据,抓取前100页最新评论数据和差评数据作为分析对象
-
使用的主要工具:接入京东电商API数据采集接口 python --jupyter notebook、阿里云数据库、Navicat Premium(My SQL)
二、项目目标
-
随着当今时代电子信息技术的飞速发展,网购已经普及千家万户,给电商行业的发展带来了巨大的机遇,与此同时,这种需求也推动了更多电商企业的崛起,引发了激烈的竞争。而在这种激烈竞争的大背景下,除了提高商品质量、压低价格外,了解更多消费者的心声对电商企业来说也变得越来越有必要。其中,一种非常重要的方式就是对消费者的评论文本数据进行内在信息的分析。
-
评论信息中蕴含着消费者对特点给产品的主管感受,反应了人们的态度、立场和意见,具有非常宝贵的研究价值,对企业来说分析评论数据可以更好的了解客户的喜好,从而针对性的提高服务和产品质量,增加自身的竞争力,对于用户自身来讲可以为购物抉择提供更多的参考依据,本次分析主要想实现以下目标:
-
对京东商城中韶音 AfterShokz Aeropex AS800骨传导蓝牙耳机的评论进行情感分析
-
从评论文本中挖掘用户的需求、意见、购买原因及产品的优缺点等信息
-
根据模型结果给出产品改善的建议
-
三、分析方法与分析过程
-
主要分析步骤如下:
-
使用python对韶音 AfterShokz Aeropex AS800骨传导蓝牙耳机在京东商城中的评论信息进行爬取
-
使用python对爬取到的数据进行数据清洗、数据分词、停用词过滤的数据清洗工作
-
对处理后的数据进行情感分析,把评论文本根据情感倾向分为正面评论数据(好评)和反面评论数据(差评)
-
对正、负评论数据进行LDA主题分析,提取其中有价值的内容
-
.jd.item_get
公共参数
名称 类型 必须 描述 key String 是 调用key(必须以GET方式拼接在URL中) secret String 是 调用密钥 api_name String 是 API接口名称(包括在请求地址中)[item_search,item_get,item_search_shop等] cache String 否 [yes,no]默认yes,将调用缓存的数据,速度比较快 result_type String 否 [json,jsonu,xml,serialize,var_export]返回数据格式,默认为json,jsonu输出的内容中文可以直接阅读 lang String 否 [cn,en,ru]翻译语言,默认cn简体中文 version String 否 API版本 请求参数
请求参数:num_iid=10335871600
参数说明:num_iid:JD商品ID
响应参数
Version: Date:
名称 类型 必须 示例值 描述 item
item[] 0 获得JD商品详情
-