在降本提效背景下,用户画像资产在人维数据中占用大量资源,历史遗留问题较多,数据治理迫在眉睫.本文将从项目背景、项目挑战、项目计划、项目成果四个方面进行分享和阐述。希望分享能帮到大家。1、项目背景重点讲解业务和技术背景。首先是商业背景。目前,云音乐用户增长的瓶颈是亿级用户、千万日活用户、数亿月活用户。增加用户的成本极高,精细化运营已经是破圈的必由之路。面对不同的用户群体和不同的商业化潜力,需要对不同人群的商业化进行分层,才能更好地帮助用户精细化运营。除了主站业务的拓展,子业务的拓展也迫在眉睫。用户画像可以帮助子业务从主站业务中挖掘和拓展所需用户群体,助力业务拓展,扩大丹云音乐的整体收入。除了技术背景,主要分为三个部分。历史用户画像构建标签重复构建,相关画像表多达32张,有的依赖很多层级,标签重复构建。选品不统一,多套产品,比如缪斯、诺兰、狙击手等,产品端需要一定程度的重组。圈选产品的响应速度也是整个产品获得用户依赖的核心指标。需要通过一定的技术改造,实现从sql圈到ms级别的圈选能力。综上所述,可以总结出云音乐用户画像资产目前存在链路耦合强、存储成本高、标准不统一、产品性能不足等问题。2.项目挑战数据侧难点:量大、链接长、时效性低、口径多。数量多体现在用户画像涉及的指标有上千个。这些指标需要统一管理,保证指标与对应表之间的高内聚和底耦合。任务环节中有7-8层的多个任务层级。层次越多,任务的稳定性越差,需要压缩任务环节;在时效性方面,现阶段任务时效性不高,每天产出时间在10点左右,远远不能满足用户要求的6分时效性要求。压缩输出时间;关于任务的一致性,是需要进行的,但是人像指标那么多,如何做到指标的一致性是一个很大的挑战。3.项目方案3.1方案框架基于以上内容,如何管理这些脏乱差的数据是值得我们花时间去做的。本项目根据实际可实现的内容,对整个项目计划进行梳理和完善,将治理成本降低和产品效率提升作为解决方案的两条主线,如下图所示:从图中可以看出,整个项目分为五层。BottomLayer为画像底层表层,包括流量数据、用户中台数据、内容数据、会员数据、社区数据等数仓公用层数据;上层为画像逻辑层,通过对底层数据画像、用户行为画像、用户统计挖掘几大块内容的实体关系建模,抽象为用户群。用户画像的逻辑层建模是实现整个画像层,可以做到数据一致性标准,保证高内聚低耦合,同时也保证整体的可扩展性。比如新增游戏服务,那么只需要在行为画像中添加游戏实体,就可以实现整个逻辑层的可扩展性,而无需重构整个内容。画像的应用层,测试整个画像的输出部分,包括画像的核心fullscale表,以及各种画像的切片画像,比如会员画像,日画像,月画像等等.画像产品层是基于画像数据的画像产品,包括魔镜选择产品、实现标签管理的标签工厂、实现标签服务的标签服务能力等。整个画像的管理涉及到画像逻辑层和画像应用层,包括画像的输出保障和离线任务。再往上就是最终服务业务的业务产品。通过打通业务产品的能力,比如打通灵趣,魔镜可以实现从用户群选择到用户推送的构建。还有Libra、MusicianOperations等产品。3.2标签构建用户画像标签构建基于需求触发,需求研究案例如下左表。需求来源包括各种线分析师、魔镜、标签厂产品、运营同学等。结合数据仓库分层和ER实体关系建模的方法,依托业务需求,设计画像逻辑层。实现数据的高内聚和低耦合,从而保证良好的可扩展性。比如歌单、歌曲、直播、MV都是实物。可以通过与用户的二元交叉乘法得到相关数据指标,后续业务拓展博弈也可以直接实现用户交叉乘法博弈,实现横向实体扩张。保证实体内数据的高内聚性和实体间数据的低耦合性。3.3保障体系保障体系的重点是对数据质量的监控和保障,以数据的稳定性、一致性、及时性、唯一性、完整性和准确性为核心保障内容。详细的工具和方法如下图所示:3.4任务离线任务离线机制主要以策略和工具为主要手段,逐步推进离线。3.5魔镜产品用户画像下游连接魔镜产品,实现用户画像表中各项服务的圈层选择功能,下游连接各种产品投放产品,实现画像数据的业务赋能。4.项目成果项目成果分产品价值、治理价值、商业价值三部分进行说明。4.1产品价值统一数据服务,基于画像数据和标签元数据,提供高效的标签服务和圈层选择服务,基本覆盖云音乐所有商圈选择服务,应用于用户运营、线上活动、AB实验、广告投放放置等产品和场景。提供统一的数据开放接口,为用户运营、线上活动、AB实验、广告等全业务线提供服务,实现一次开发多个产品,降低人力开发成本。产品累计实现1900余组精选、百亿次精选、超过500万次推送服务,覆盖数十亿音乐用户和数百+标签。4.2整体治理价值预计下线32张表,管理上千个标签。预计每年节省存储成本近150万元,计算成本每年节省近200万元。预计每年总计可节省300万元以上。4.3商业价值除了产品链接打通后大大节省推送时效外,还有子业务画像服务场景,也极大地体现了商业价值。例如,一个子业务利用主站的用户标签数据,每天可以吸引成千上万的新用户,每年可以节省大约几千万的成本。
