在智能营销场景,如美团满减券、淘宝购物红包等,需要形成系统的营销决策。基于这样的场景,快手提出了一种新的多元因果森林模型,以实施更细粒度的营销决策。快手社群科学部基于快手亿级用户,设计并行资源分配算法,高效生成智能营销决策。为了解决多元因果模型的评价问题,本研究采用随机匹配??的思想,提供一种方法供业界参考。最后通过离线仿真实验和在线真实A/B实验验证了LBCF算法的有效性。该技术已申请中国发明专利,并广泛应用于快手智能营销业务。异质因果效应(HTE)是因果推理理论需要解决的核心问题,其概念最初起源于医学领域。HTE是指对于同一种干预,对不同受众的影响因人而异,在计算广告、个性化治疗、个性化教育、公共政策等方面有着广泛的应用。为了理解它的概念,我们举一个智能营销领域的例子。同样补贴强度的营销方式,有的受众会马上转化,有的受众可能根本转化不了。如何准确区分这些受众是HTE需要解决的问题。近年来,学术界出现了新的HTE方法。其中,由斯坦福大学经济学教授SusanAthey等人提出的因果森林模型[1]。因其良好的可解释性和优异的效果,逐渐被业界认可。论文链接:https://arxiv.org/abs/2201.12585论文代码:https://github.com/www2022paper/WWW-2022-PAPER-SUPPLEMENTARY-MATERIALS大规模智能营销算法Multivariatecausalforestmodel智能营销待定研究的核心问题是,不同补贴金额的用户转化效果有多大差异?这些不同的补贴金额在因果推理中可以看作是治疗,因此场景驱使研究者去研究用户在不同治疗下的转化效果,即需要一个多元因果模型。基于树的模型具有良好的可解释性,并在机器学习中显示出良好的效果。在本文中,这项研究主要考虑基于树的HTE估计方法。该方法可以应用于任何需要估算HTE的领域。本文仅以智能营销场景为例进行说明。本文提出的多元因果森林模型,模型结构如图2(示意图示例)所示,该模型结构有两个优点:第一,单个模型可以同时处理任何一种干预,否则,多个干预措施需要维护相应数量的二元因果森林模型;其次,HTE的定义要求每次干预都对应一个一致的特征子空间,这是由模型结构保证的,这对于准确估计HTE至关重要。图2多元因果林模型(注:图2中Age,Inc.等数据仅供说明)。因此,本研究重新设计了因果林的分裂标准。在分裂树节点时,不仅强调不同节点间的异构性,即节点间分裂(InterSplit),还强调节点内不同干预方式的异构性,即节点内分裂(IntraSplit).在计算复杂度上,在寻找树节点的特征分裂点时,InterSplit可以一次性快速预计算分裂所需的数据,而IntraSplit则依赖于树节点之间的分裂结果,所以IntraSplit每次拆分后的数据都需要重新计算,效率极低。为了平衡算法的效率和效果,本研究采用两步分裂算法:第一步通过InterSplit选择前N个候选特征分裂点;第二步通过IntraSplit特征分割点从N个候选中选择一个最终分割点。资源分配并行算法解决用户弹性估计问题后,在智能营销领域输出营销决策时,往往需要回答如何在有限的资源约束下实现最优分配。为此,本研究将智能营销中的资源分配问题建模为约束整数规划数学模型,如图3所示。但是,快手的快手级别的用户数导致大量的决策变量。目前很多开源求解器不能满足性能要求,会出现内存溢出等问题。图3整数规划数学模型为此,本研究设计了一种并行的双梯度二分法(DGB)算法,如图4所示。该算法在不损失解质量的情况下为亿级用户实现了分钟级的解。限于篇幅,这里简单介绍一下解决思路。详情请参考论文和附录代码。第一步是使用线性松弛技术将图3中的整数规划数学模型简化为易于求解的线性规划问题。可以证明,松弛线性规划问题的解集在临界预算下至多有一个非整数解。第二步,通过拉格朗日乘子将约束问题转化为无约束问题。第三步,由于问题满足强对偶条件,研究者对问题进行对偶变换,从而得到关于拉格朗日乘数的单变量分段函数,可以证明该分段函数是闭区间凸函数在。第四步,通过图4中的DGB算法,研究人员可以在并行系统上进行高效计算。第五步,代回对偶问题,依次求解所有决策变量的取值。图4.并行DGB算法多元因果模型评估由于无法观察到因果模型的反事实结果(CounterfactualOutcome),如何评估因果模型的离线效果成为业界亟待解决的问题。常用的评价方法有AUUC/QiniCurve等,但这些更适合评价二元因果模型;对于多元因果模型的估计结果,只能先将多元结果拆解成许多二元结果,再分别进行评估。本文采用随机对照试验(RCT)数据,基于TreatmentMatching的思想,提供一种整体效益比较的方法。核心方法是在RCT数据中找到那些匹配PolicyTreatment和RCTTreatment的样本。需要指出的是,对于这些匹配样本,我们可以观察到真实的结果。其次,可以证明这些匹配样本的均值是对其列期望值的良好估计。最后,利用每一列的期望值,我们可以计算出多元因果模型的整体回报,回报越高,模型越好。效果展示为了公平比较算法效果,首先,本研究使用叶图等人发布的仿真数据集。在WWW2021[2]上,与业界主流的基于树的因果模型进行线下对比,如图5所示,横轴为数据集噪声强度,纵轴为收益研究人员关注的核心指标。可以看出LBCF效果最好,其次是CT.ST和CF.DT。图5.离线模拟实验更进一步。本研究将LBCF算法部署在快手的真实智能营销场景中,进行了为期两周的A/B实验,如图6所示,结果也证明了算法的有效性。与CT.ST和CF.DT算法相比,收益分别提高了0.92和2.48个百分点。图6在线A/B实验总结快手的研究人员在论文中提出了一种新的HTE预测方法——多元因果森林模型,结合高效的整数规划算法,效果明显优于常用的几种树模型方法在工业中使用。同时,研究人员还创新性地针对行业内难于离线评估因果效应的问题提出了可行的解决方案。研究人员希望本文的工作能够引起机器学习爱好者的关注,从而在他们的实际业务中更广泛地应用因果推理技术。
