当前位置: 首页 > 科技观察

【大咖来袭第四期】数据驱动产品决策与智能

时间:2023-03-16 17:11:03 科技观察

数据与产品链接的结合。StitchFix是一家数据驱动的服装新零售电商。它致力于帮助用户找到适合自己的款式。主要服务于没时间逛街、不擅长穿搭、追求时尚的用户群体。StitchFix的所有销售额都来自推荐。推荐的是盲盒模型。用户在收到产品之前并没有预览过,这意味着他们需要猜测用户会喜欢哪些衣服。如果猜错了,就要消耗造型师服务和双向物流的真金白银成本,所以对准确性的要求非常高。如下图所示,从普通用户的角度来看,使用StitchFix主要分为三个步骤。Set.1是回答一份个人风格问卷,然后你会收到五件搭配的衣服。试穿后,喜欢的留着,不喜欢的免费退回。StitchFix鼓励用户对每件衣服的尺码、价格、合身性、款式和颜色给予反馈。这些数据将帮助数据科学团队更好地了解用户与服装的搭配情况。数据科学团队占员工总数的1/4,这也意味着数据科学已经渗透到产品的很多方面,发挥了应有的价值,比如仓配、用户与造型师的匹配、用户画像、人货匹配、库存管理等。例1:仓库分配当用户发出请求时,需要决定从哪个仓库发货给用户。选择发货仓库需要综合考虑多个因素,包括运费、发货时间、仓库风格与用户风格的匹配等,根据这些因素建立仓库与用户的匹配指标。示例2:用户与造型师匹配当用户发送请求时,根据用户与造型师的交易记录、用户评分、数据匹配匹配造型师。示例3:StitchFix中的用户画像用户画像既服务于算法,也服务于造型师,因此需要一些能够被人解释和理解的用户画像。用户画像大部分来自于用户填写的个人问卷,包括基本的纬度画像,和服装相关的,比如用户的体型、颜色、价格偏好等。在处理用户风格时,服装的风格是分为七个纬度:经典,浪漫,波西米亚等。每个用户在每个纬度上都有1到4的分数。根据用户评分,可以大致看出用户的着装风格。示例四:人货匹配这里主要分享两个层面的数据和模型。数据层面包括:用户画像、产品ID、产品泛化特征(图片、标签)、多维反馈。推荐算法的数据存在挑战,如物品样本不平衡、数据回流导致的错误、缺失特征和反馈数据、折扣导致的偏差等。模型层面(2016年),有混合效应模型,Factorizationmachine,DNN,word2vec,LDA等。例5:库存管理在库存管理中,需要解决的问题很多,比如有哪些商品可用,买什么货,买多少,分配到哪个仓库,哪些库存需要清空等等.哪些货是可用的,看似简单的问题,但在StitchFix中却很特别,因为库存货实际上只占所有商品的40%,并且有大量商品在从用户到仓库的途中,或者从仓库到用户的途中,这里需要做模拟和库存快照来处理它。通过这些产品的上述链接,可以找到用数据提升效率的机会,定义问题并解决问题。那么是用什么技术来实现的呢?这里主要分享大家普遍关心的三大问题,metrics的选择与分析,AB测试,用户画像。StitchFix在指标的选择和分析上,着重于转化率、GMV、留存这三个核心指标。对于指标的选择,可以参考三点:数据来源的可靠性、指标与结果的相关性、信号质量和灵敏度。StitchFix常用的分析主要有漏斗、分组、多维等,下图以分组分析为例。例如,可以根据获客时间和首单时间对用户进行分组,然后在一定时间范围内观察某些指标的变化。对于时间跨度,可以选择比较短的时间跨度,也可以选择比较长的时间跨度。下图是不同获客时间的用户留存率对比。整体来看,1-7月,首月留存有所提升,意味着在渠道获取方面,获取用户的质量有待提升。另外也可以看出,随着时间的推移,用户留存会产生平台效应。前四个月用户逐月流失比较明显,后续用户留存趋于稳定。AB测试在StitchFix,AB测试主要面临两个挑战,即线下交易带来的延迟和造型师的人为因素。当在线算法发生变化时,需要造型师为每个用户进行匹配,加上物流,会有七到十天的延迟。造型师的人为因素主要是造型师的惰性造成的。举个极端的例子,如果算法要重新推荐高价位的商品,而造型师要向用户推荐一些中等价位的商品,这样就会影响结果产生差异。这里需要提醒的是AB测试需要谨慎,需要注意以下四点:实验正交设计:实验一:uid尾数为奇数vs偶数实验二:uid尾数(0,1)vs2用户适应曲线小流量实验与全流量投放的差异叠加在实验效果上:本季度投放了6+1%的实验,但整体增幅仅为3%。在中国大陆和台湾,画像对于推荐业务、用户运营、渠道画像等都会有相当大的指导意义。这意味着画像需要公司内部多部门协作,同时也因为多部门协作带来了挑战,主要体现在数据与应用的脱节和多业务需求的相似性。其实生成画像需要三个步骤,分别是收集画像需求,搭建标签框,填写数据。在实际过程中,如果想要破局,有以下三个建议:摒弃大而全的框架,逆向业务场景(价值)自动生成标签(手段):规则或算法有效的标签管理机制(可持续性)数据第二个主题是数据与人的结合。在StitchFix中,算法和造型师相结合,帮助用户进行推荐。它可以被认为是一个人机耦合系统。那么,人机耦合系统将面临哪些挑战?算法方面,Set.1需要对大量库存进行SKU筛选和排序,第二点从大规模数据中寻找规律。三是降噪,因为造型师会有相当大的个体差异,需要制定一个相对一致的标准,这样最终的筛选结果才不会出现较大的偏差。在人机耦合系统中,造型师扮演人的角色,处理非结构化数据,进行1v1的情感交流,同时也具有创造性,使得算法开发可以避免考虑边缘情况。这种人机协作的方式,不单纯依靠机器算法,也不单纯依靠人工。机器可以承担更多繁重、重复的劳动任务,拥有大量的工作记忆和长期记忆,而人类则可以更好地处理非结构化数据,进行审美评价,与客户建立良好的人机关系。关系。另外,人对场景也会有很强的敏感度。比如秋天来了,中西部的人适合穿什么样的衣服。造型师对此会有很强的敏感度,进而做出更好的推荐。在人机耦合中,虽然1+1大于2,但人机耦合也面临以下问题:人会成为速度和规模的瓶颈:订单的分布与造型师的工作时间不匹配人机价值算法的多反馈渠道:用户反馈和设计师应谨慎选择算法的优化目标。第三部分是数据和团队的结合。这部分主要介绍整个数据团队,包括分析、算法、数据开发。怎么结合,整个数据团队在公司的架构体系下怎么跟业务团队配合。数据和团队的结合,其实在讲大数据的时候,我们讲了很多方法论和思维框架,但是最终还是要靠数据团队的人去实现,并为数据提供价值。公司。StitchFix数据团队主要分为四个部分。底层数据开发团队可以构建数据平台和数据仓库,数据科学家可以提高效率或制作部署工具。以上三个团队分别与业务、客户团队、推荐团队、库存团队一一对应。在数据团队建设方面,参考三个定位原则:以业务和产品为核心。聚焦产品和业务,让数据产生真正的价值。数据科学团队要结合基础设施部门和业务部门,尤其是业务跨度大的公司决策层的耐心支持,与具体的工程和产品团队成为一个有机的整体。目标对齐在实际操作中,请注意你会面临以下问题:如何将分析结果落地,如何做可以落地的分析和分析来处理数据需求和数据驱动的业务,处理数据相当于一个被动的东西,数据团队经常面临的是为业务部门拉取数据的任务,但同时数据团队也需要主动驱动业务,这可以认为是被动和主动之间如何协调.数据平台团队在保证数据平台稳定性的同时,也尽可能开发帮助数据科学家做更好的数据流转,尽可能部署代码和线上工具。