客户画像中的聚类分析

                                                             客户画像会用聚类分析

 

       实际工作中,最常使用的当属回归类模型,其次便是客户画像。即便是评分模型也会涉及到客户画像,由于首富客户的违约特征与普通百姓不同,故需进行区分,信用分池即为客户画像

       客户画像使用的技术为聚类分析在营销场景中经常会逻辑回归模型与聚类分析一起配合构建模型

                                                                 聚类分析是什么?

         聚类分析可以理解为利用数据公式具体的计算样本的相似程度,将相似的样本归为一类,将不相似的样本归为一类。例如:

  • 对奶茶加盟店的经营业绩进行分类;
  • 对来商场消费的客户进行分类;

  • 评估一个产品的好坏时,将繁复的评价指标进行分类,从而简化评估体系

       聚类分析专门针对看上去不好区分、但必须区分的数据。决策树、逻辑回归模型以及神经网络中皆有Y,样本中已经区分出了好坏,最终好坏样本差距越大则说明模型效果越好,如好坏样本无差别,则模型有错误需要修正。但如果样本中没有Y,则加大了好坏样本的区分难度,此时便需要使用聚类分析

                                                   聚类分析与逻辑回归是不同的模型体系

       模型可以大致理解为两种:

  • 有监督模型、验证性模型、预测模型有X有Y,例如逻辑回归模型、决策树模型以及神经网络
  • 无监督训练模型、探索模型、模式发现有X无Y例如聚类分析,有Y无X例如产品推荐算法

       需要说明的是,模式发现实现的技术较多,但是大部分只是存在于博士论文之中,实际工作中能够到的很。由于与预测类模型相比,模式发现对数据的要求极高,例如,在从实际应用效果的角度来看,聚类分析对数据的要求要比所有的分类选择模型的要求高许多,即聚类分析的假定要严格许多,只是大部分情况下, 人们使用聚类分析的时候,不会提及到它的假定罢了。

                                                             聚类分析的弊端?

       决策树有一个最大的弊端,即变更数据集后,做好的规则变动较大,即便变量固定仅仅换了观测,决策树的结果也会完全不同,但是,即便决策树的变动性如此大,决策树都要比聚类分析稳定的多

       可见聚类分析是如此的不稳定,因此想做好聚类分析,必须要遵循完整的数据分析流程,才能够保证建模数据的稳定以及结果的可靠

                                                             聚类分析的流程?

       聚类分析的基本流程为:

  • 数据准备:包含变量与观测的选择、变量的分布分析以及量纲选择
  • 聚类分析
  • 聚类后处理:包含类数的确定以及标签的确定
  • 模型的部署

       需要注意的是,虽然变量聚类也带有聚类两个字,但是并不是聚类分析算法,而是一种主成分分析。而且,由于业务人员不懂聚类算法,所以需要聚类分析后,构建完善相应的标签系统

                                                            红楼梦到底谁写的?

       可以使用聚类分析来判断红楼梦的作者,通过分析红楼梦的语言风格,将红楼梦120回中的每一回视作一个观测,将虚词频次视作分析变量,做聚类分析。

       单独对前八十回进行聚类分析,分析发现前八十回语言风格非常相似,则可以判断前八十回的作者为同一人(曹雪芹);单独对后四十回进行聚类分析,分析发现后四十回无法聚为一类,则可判断后四十回的作者并非为同一个人;对前八十回与后四十回进行聚类分析,分析发现前后两部分无法聚为一类,则可判断后四十回可能不是曹雪芹所写。

       所以,关于红楼梦的作者,很多资料中说其前八十回由曹雪芹所著,后四十回由无名氏编写高鹗编辑,很有意思

我的公众号:Data Analyst

个人网站:https://www.datanalyst.net/

 

 

 

 

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/65169.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

用户画像 客户喜好消费的商品分类模型表

日萌社 人工智能AI:Keras PyTorch MXNet TensorFlow PaddlePaddle 深度学习实战(不定时更新) 用户画像 总文章 客户喜好消费的商品分类模型表 订单中 商品类目表 GDM层(临时表)SQL目的:统计用户订单…

如何做好会员用户画像分析,比消费者本身更懂自己?

随着各平台知识付费开启,“万物付费时代”已悄然而至。线下传统的粗犷式运营模式已不再符合时代潮流。如何在这样一个付费时代做好企业的精准化会员客户策略分析管理,成为当今人们尤为关注的话题。 作品背景: 某连锁超市在各地有80家线下零…

如何给你的客户画像

悟空CRM ​ 已认证的官方帐号 14 人赞同了该文章 为客户画像需要利用所有自有和第三方可以收集和利用的数据信息,通过信息综合和特征分析,形成对该客户的整体特征的全面认识。客户画像包括面向企业、组织的机构客户画像和面向消费者的个人客户画像。客户画像面向的对象不同…

如何构建用户画像来实现精准营销?

用户画像,又称人群画像,是根据客户人口统计学信息,社交关系,偏好习惯和消费行为等信息而抽象出来的标签化画像。 构建客户画像的核心工作即是给客户贴“标签”(犹如娱乐圈中明星的立人设) 标签由两部分组…

SPSS 市场细分:客户画像\客户价值模型

行为标签(x)\价值标签(y) 客户行为标签的制作步骤X: 判断x的个数分组:通过聚类算法(系统聚类、K均值聚类、俩阶段聚类、神经网络聚类);制作标签(重点&#…

客户流失及用户画像分析

1 项目背景 在今天产品高度同质化的阶段,市场竞争不断加剧,企业与企业之间的竞争,主要集中在对客户的争夺上。“用户就是上帝”促使众多企业不惜代价去争夺尽可能多的新客户。但是,在企业不惜代价发展新用户的过程中,…

淘宝用户行为分析——用户画像

文章目录 一、数据介绍二、数据预处理2.1 数据抽样2.2 缺失值处理2.3 日期与时段处理2.4 制作用户标签表 三、用户行为标签3.1 用户浏览活跃时间段3.2 用户购买活跃时间段3.3 关于类目的用户行为3.3.1 浏览最多的类目3.3.2 收藏最多的类目3.3.3 加购最多的类目3.3.4 购买最多的…

消费者用户画像分析

项目描述 你拥有一个超市(Supermarket Mall)。通过会员卡,你用有一些关于你的客户的基本数据,如客户ID,年龄,性别,年收入和消费分数。消费分数是根据客户行为和购买数据等定义的参数分配给客户的。 问题陈述&#xf…

用户画像系列——Lookalike在营销圈选扩量中的应用

在用户画像系列——当我们聊用户画像,我们在聊什么? 介绍了用户画像的应用场景: (1)个性化推荐 通过用户标签给用户推荐合适的商品或者内容 (2)营销圈选 根据组合条件(比如说:性别女、年龄25-30、都市白领)圈选出一部分用户,给他们发送p…

一键上手时下最火AI作画工具

摘要:在华为云ModelArts上, 无需考虑计算资源、环境的搭建,就算不懂代码,也能按照教程案例,通过Stable Diffusion成为艺术大师。 本文分享自华为云社区《跟着华为云ModelArts,一键上手时下最火AI作画工具》…

模型压缩总结

1.模型复杂度衡量 model sizeRuntime Memory Number of computing operations model size 就是模型的大小,我们一般使用参数量parameter来衡量,注意,它的单位是个。但是由于很多模型参数量太大,所以一般取一个更方便的单位&am…

2019 智见 AI workshop in Beijing

[持续更新]2019 智见 AI workshop in Beijing 前言代季峰:卷积神经网络中的几何形变建模Deformable Conv V1Deformable Conv V2Tricks & Exprience 张士峰:物体检测算法的对比探索和展望Detector Algorithm Overviewanchor-basedanchor-free RefineD…

湖北黄冈中学2021年高考成绩查询,2019年黄冈中学高考成绩发布,包揽全市文科前13名,省内排名却不值一提...

2019年黄冈中学高考成绩发布,包揽全市文科前13名,省内排名却不值一提 2019年6月23日,黄冈中学公布了2019年黄冈中学的高考成绩,如下图所示,今年黄冈中学的高考成绩相比2018年略有提高。 全校参考总人数共883人&#xf…

Paper | Densely Connected Convolutional Networks

目录 黄高老师190919在北航的报告听后感故事背景网络结构 Dense blockDenseNet 过渡层成长率瓶颈层细节实验 发表在2017 CVPR。 摘要 Recent work has shown that convolutional networks can be substantially deeper, more accurate, and efficient to train if they contain…

黄冈中学2021高考成绩查询,清华公布2021丘班录取名单,黄冈中学表现尴尬,衡中无人上榜...

每个学生心中都有个清华和北大梦,只不过后来发现自己能力有限,清华北大更是遥不可及,学生眼下的想法只是纠结能不能考上重点大学,但是这也并不妨碍大家对名牌院校的好奇心。 清华大学一直是理科学生梦寐以求的高等学府&#xff0c…

清华商汤上海AICUHK提出Siamese Image Modeling,兼具linear probing和密集预测性能!...

关注公众号,发现CV技术之美 本文分享论文『Siamese Image Modeling for Self-Supervised Vision Representation Learning』,由清华(黄高组)&商汤(代季峰组)&上海AI Lab&CUHK提出Siamese Image…

2022CVPR云分享 | 清华大学四位讲者带你玩转计算机视觉

点击蓝字 关注我们 AI TIME欢迎每一位AI爱好者的加入! 7月20日晚上7点半,本期我们邀请到清华大学黄高老师实验室的四位讲者,为大家解读2022CVPR的优秀论文! 哔哩哔哩直播通道 扫码关注AI TIME哔哩哔哩官方账号预约直播 7月20日 19…

【线上直播】SFFAI 99 期 数据扩增专题

会议简介 在计算机视觉任务中,数据扩增是一种基于较少数据、产生大量训练样本,进而提升模型性能的有效方法。传统数据扩增方法主要借助于图像域的翻转、平移、旋转等简单变换。而本期讲者王语霖提出了一种隐式语义数据扩增算法,对样本进行更…

【活动报名 | 青源Talk第3期】DenseNet发明者黄高:面向边缘设备的轻量神经网络...

活动议程 日期:12月10日(周四) 时间 主题19:00-19:05开场简介刘知远,清华大学计算机系副教授,智源青年科学家19:05-19:50《面向边缘设备的轻量神经网络》黄高,清华大学自动化系助理教授,智源青年…

不是所有图像都值 16x16 个词,可变序列长度的动态 Transformer 来了!

转自 | AI 科技评论 编辑 | 陈大鑫 最近半年,Transformer在视觉领域大获成功,其中的代表作就是谷歌的工作ViT:《An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale》。 以ViT为代表的视觉Transformer通常将所有输…