相关标签的基础上加工而来。
标签的加工逻辑是对用户群体进行聚类,分析每类人群的行为特征/偏好,形成用户群体标签。例如,某电商平台通过对‘女性白领’用户群体的偏好特征进行分析,为符合此类人群的新用户做产品推荐以提升转化率。
这类标签的梳理重点有两个,一是关键业务流程节点及所代表的业务含义,二是应用场景的明确。
上图是一个相对通用的标签体系架构,在梳理标签和画像时,这是一个很好的参考框架,通过这个框架梳理业务场景和目标,再反向设计标签。标签的设计与应用一定要基于对业务和架构的理解。
STEP 3:明确标签规则口径
确定了标签的分类体系,下一步就是确定规则和挖掘类标签口径,包括调整优化模型及相关权重配置;
对于标签规则的确定,在业务发展初期时,通常以业务性质(如高频/低频)、结合数据分布形态以及运营人员的业务经验为判断依据。
在业务发展到有一定的用户规模时,通常需要结合数据挖掘的形式以优化调整标签规则/逻辑。
需要注意的是,标签的搭建也需要考虑“ROI”,即投入的人力开发等成本与本身业务可带来的直接收益。
标签体系的搭建其实跟做产品一样,业务发展初期,可以通过上线‘最小可用性’的标签规则1.0,就能带来很好的效果,能使用规则的标签优先使用规则标签。
一开始就去做大而全的挖掘类标签实用性就没有那么强了。
很容易理解,用户体量1000万时2%转化率的提升价值,和用户量1000的2%的转化率价值是有很大差异的。
所以,搭建用户标签画像应随着业务体量的增大,不断丰富标签画像体系。
关于“不断丰富”
因为标签是数据产品,需要持续迭代和优化,所以要用产品的思维来看待标签。
推荐体系需根据用户历史行为推测用户偏好,因此用户行为数据的积累是推荐系统的前置条件。
对于有历史行为数据的用户,需要明确偏好标签的规则,即标签权重。
关于“标签权重”
因为营销资源是有限的,且并不是用户的需求都需要满足,事实上,能够满足用户20%的核心需求就已经OK了。所以需要将用户画像的特征标签打上权重,才能有轻重缓急的去针对性营销。
用户在平台上的不同行为,对应到用户标签层面有着不同的行为权重。该权重影响着对用户属性的归类。属性归类不准确,后续基于画像对用户进行推荐、营销的准确性也就无从谈起。
具体到产品层面需要用户画像建模人员与运营人员充分沟通,结合业务场景给不同的行为类型定权重,下面主要介绍通用的综合权重计算方法。
标签权重计算公式主要由以下几个参数构成:
行为类型权重:用户浏览、搜索、收藏、关注、下单等不同行为对应这不同的用户倾向权重,一般而言,操作复杂程度越高的行为权重越大,该权重值一般有运营人员根据业务经验判断。
时间衰减系数:用户的偏好并非固定不变,因此需考虑时效因素。用户某些行为受时间影响不断减弱,即行为时间距离现在越远,该行为权重越低。
用户行为次数:周期内用户与该标签产生的行为次数越多,该标签的权重越大。
TF-IDF计算标签权重:TF-IDF的统计方法是用于评估用户与标签之前的权重关系,具体来说,是指每个标签对用户的重要性及该标签在全体标签中的重要性的乘积,得出每个标签的客观权重值。对于每个用户来说,其身上同一个标签出现的次数越多,该标签对这个