用户画像系列——Lookalike在营销圈选扩量中的应用

在用户画像系列——当我们聊用户画像,我们在聊什么?

介绍了用户画像的应用场景:

(1)个性化推荐

通过用户标签给用户推荐合适的商品或者内容

(2)营销圈选

根据组合条件(比如说:性别女、年龄25-30、都市白领)圈选出一部分用户,给他们发送push或者短信告知他们最近有什么活动之类的。

(3)策略引擎

根据用户标签命中不同的策略,比如说:高消费人员有奢侈品入口通道

(4)算法模型

(5)画像报告

背景:

今天这篇文章主要分享下用户画像在营销圈选中的应用,后续会继续聊其他几个方向的应用场景。

营销圈选,顾名思义就是根据一些组合条件圈选出合适的人群,比如说:最近要搞女性的美妆促销活动。那应该很容易理解,我选出这方面需求的女性用户,然后通过发送push弹窗或者短信或者邮件等等方式来告诉用户,我们有一个美妆大促活动有什么什么优惠,然后让你来参加。

问题:

但是会出现一些问题,比如说:平台用户总共有10w,但是我根据组合条件筛选(女性用户、都市白领、年龄在25-30岁之间)出来只有5000。如果只是给这5000人发送这个需求显然是没办法达到我的要求。那有没有什么办法呢?

比如说:发现圈选的目标用户5000里面,有很多相似的地方,喜欢美妆对于满减活动也比较敏感,然后平台里面10w 用户也有不少男性用户虽然年龄超过30岁了,但是对于美妆也非常感兴趣(可能是给女朋友买?)

那想到一种办法是不是可以通过这5000用户,去全量用户里面找和这些用户比较相似的一些人呢?通过这5000个用户找到和他们相似的2.5w个用户,加起来3w,给这3w人发送营销活动。

解决方案:

上文中提到的5000个用户称呼为“种子用户”,平台用户10w称之为所有用户(DMP用户),然后我们扩充出来的3w用户称之为“相似用户”或者"扩展用户"

那究竟如何才能根据种子用户找到这部分相似用户呢?

Lookalike整体业务流程如下:

 (1)根据平台的全量构建标签,也是用户画像标签的加工(dws_user_info_profile)

 (2)根据构建的用户标签进行向量化,可以参考Spark Word2Vec构建向量化(dws_user_info_profile_embe),具体内容可参考:

https://dblab.xmu.edu.cn/blog/1292/

 (3)将向量化的用户特征数据写入ElasticSearch,此处考虑用Spark 进行批量写入,提升性能,至此用户量化和入库工作就已经完成了

(4)在营销平台根据圈选条件(比如说:女性、年龄25-30岁、喜欢美妆),最后得到种子用户的id列表

(5)根据种子用户关联用户向量特征得到可以匹配上的用户的向量特征,种子用户id,种子用户向量

(6)根据向量特征去ElasticSearch 里面进行扩量

ElasticSearch 创建索引mapping 主要有两个字段,userId和vector_embedding(dense_vector),其中vector_embedding 为dense_vector类型

ElasticSearch 向量化使用参考:https://cloud.tencent.com/developer/article/1774216

通过使用ES向量化查询功能完成扩量,具体实现会涉及到扩量查询采用Spark 提升并发性,通过配置扩量倍数参数来获取每一个种子用户的Top N 扩量,最终将扩量后的数据写入HDFS目录同时通知营销平台扩量完成。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/65158.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

一键上手时下最火AI作画工具

摘要:在华为云ModelArts上, 无需考虑计算资源、环境的搭建,就算不懂代码,也能按照教程案例,通过Stable Diffusion成为艺术大师。 本文分享自华为云社区《跟着华为云ModelArts,一键上手时下最火AI作画工具》…

模型压缩总结

1.模型复杂度衡量 model sizeRuntime Memory Number of computing operations model size 就是模型的大小,我们一般使用参数量parameter来衡量,注意,它的单位是个。但是由于很多模型参数量太大,所以一般取一个更方便的单位&am…

2019 智见 AI workshop in Beijing

[持续更新]2019 智见 AI workshop in Beijing 前言代季峰:卷积神经网络中的几何形变建模Deformable Conv V1Deformable Conv V2Tricks & Exprience 张士峰:物体检测算法的对比探索和展望Detector Algorithm Overviewanchor-basedanchor-free RefineD…

湖北黄冈中学2021年高考成绩查询,2019年黄冈中学高考成绩发布,包揽全市文科前13名,省内排名却不值一提...

2019年黄冈中学高考成绩发布,包揽全市文科前13名,省内排名却不值一提 2019年6月23日,黄冈中学公布了2019年黄冈中学的高考成绩,如下图所示,今年黄冈中学的高考成绩相比2018年略有提高。 全校参考总人数共883人&#xf…

Paper | Densely Connected Convolutional Networks

目录 黄高老师190919在北航的报告听后感故事背景网络结构 Dense blockDenseNet 过渡层成长率瓶颈层细节实验 发表在2017 CVPR。 摘要 Recent work has shown that convolutional networks can be substantially deeper, more accurate, and efficient to train if they contain…

黄冈中学2021高考成绩查询,清华公布2021丘班录取名单,黄冈中学表现尴尬,衡中无人上榜...

每个学生心中都有个清华和北大梦,只不过后来发现自己能力有限,清华北大更是遥不可及,学生眼下的想法只是纠结能不能考上重点大学,但是这也并不妨碍大家对名牌院校的好奇心。 清华大学一直是理科学生梦寐以求的高等学府&#xff0c…

清华商汤上海AICUHK提出Siamese Image Modeling,兼具linear probing和密集预测性能!...

关注公众号,发现CV技术之美 本文分享论文『Siamese Image Modeling for Self-Supervised Vision Representation Learning』,由清华(黄高组)&商汤(代季峰组)&上海AI Lab&CUHK提出Siamese Image…

2022CVPR云分享 | 清华大学四位讲者带你玩转计算机视觉

点击蓝字 关注我们 AI TIME欢迎每一位AI爱好者的加入! 7月20日晚上7点半,本期我们邀请到清华大学黄高老师实验室的四位讲者,为大家解读2022CVPR的优秀论文! 哔哩哔哩直播通道 扫码关注AI TIME哔哩哔哩官方账号预约直播 7月20日 19…

【线上直播】SFFAI 99 期 数据扩增专题

会议简介 在计算机视觉任务中,数据扩增是一种基于较少数据、产生大量训练样本,进而提升模型性能的有效方法。传统数据扩增方法主要借助于图像域的翻转、平移、旋转等简单变换。而本期讲者王语霖提出了一种隐式语义数据扩增算法,对样本进行更…

【活动报名 | 青源Talk第3期】DenseNet发明者黄高:面向边缘设备的轻量神经网络...

活动议程 日期:12月10日(周四) 时间 主题19:00-19:05开场简介刘知远,清华大学计算机系副教授,智源青年科学家19:05-19:50《面向边缘设备的轻量神经网络》黄高,清华大学自动化系助理教授,智源青年…

不是所有图像都值 16x16 个词,可变序列长度的动态 Transformer 来了!

转自 | AI 科技评论 编辑 | 陈大鑫 最近半年,Transformer在视觉领域大获成功,其中的代表作就是谷歌的工作ViT:《An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale》。 以ViT为代表的视觉Transformer通常将所有输…

国内有哪些不错的计算机视觉团队?

来源:深度学习技术前沿 编辑:Evans 【导读】计算机视觉是当前人工智能领域的超级热门,本文为大家总结了当前国内比较优秀的计算机视觉团队信息,希望能在大家申请硕士或者博士的过程中,提供一些参考信息! 作…

圆形的CNN卷积核?华中科大清华黄高团队康奈尔提出圆形卷积,进一步提升卷积结构性能!

作者丨小马 编辑丨极市平台 写在前面 目前正常卷积的感受野大多都是一个矩形的,因为矩形更有利于储存和计算数据的方便。但是,人类视觉系统的感受野更像是一个圆形的。因此,作者就提出,能不能将CNN卷积核的感受野也变成圆形呢&a…

深入浅出的模型压缩:你一定从未见过如此通俗易懂的Slimming操作

点击上方“计算机视觉工坊”,选择“星标” 干货第一时间送达 作者丨科技猛兽 编辑丨极市平台 导读 本文首先介绍了模型压缩领域的指标含义,并通过梳理文献,介绍了模型压缩领域常用的方法。随后对Slimming这一模型压缩方法进行了详细介绍&…

Dropout技术之随机神经元与随机深度

1. 写在前面 在学习复现EfficientNet网络的时候,里面有一个MBConv模块长下面这个样子: 当然,这个结构本身并不是很新奇,从resNet开始,几乎后面很多网络,比如DenseNet, MobileNet系列&#xff0…

如何做高质量研究、写高水平论文?| 黄高、王兴刚等共话科研与论文写作

如何产生好的研究思路?如何撰写一篇高质量论文?如何从浩如烟海的论文中寻找好的科研灵感?如何通过Rebuttal为自己的文章扳回一城?导师跟学生之间怎样才能形成更好的合作关系? 在ECCV 2022中国预会议的Panel环节&#x…

智源青年科学家黄高:面向高效推理的深度网络结构设计

随着深度学习在工业界的广泛应用,人们对模型的关注不仅仅在于其预测精度,同时也对计算和存储效率提出了更高的要求。在提升模型效率的诸多手段中,神经网络结构创新始终是最为有效的方式之一。 2019年12月24日上午,智源青年科学家、…

RANet:MSDNet加强版!清华黄高团队提出分辨率自适应的高效推理网络RANet!

关注公众号,发现CV技术之美 本文分享论文『Resolution Adaptive Networks for Efficient Inference』,由清华黄高团队提出分辨率自适应的高效推理网络RANet!MSDNet加强版! 详细信息如下: 论文链接:https://…

ICLR2021 | 清华大学黄高团队:显存不够?不妨抛弃端到端训练

智源导读:本文主要介绍清华大学黄高团队被ICLR2021接收的一篇文章:Revisiting Locally Supervised Learning: an Alternative to End-to-End Training。 论文链接:https://openreview.net/forum?idfAbkE6ant2 代码链接:https://g…

清华大学黄高——图像数据的语义层扩增方法

⬆⬆⬆ 点击蓝字 关注我们 AI TIME欢迎每一位AI爱好者的加入! 2020 年 9 月 25 日,在由中国科协主办,清华大学计算机科学与技术系、AI TIME 论道承办的《2020 中国科技峰会系列活动青年科学家沙龙——人工智能学术生态与产业创新》上&#xf…