今天,机器学习模型已经成为业务决策的主要驱动力。与其他业务策略一样,这些机器学习模型需要随着时间的推移进行修改。技术原因是“模型漂移”。虽然大多数课程、文章和帖子都描述了机器学习(ML)生命周期(从数据收集开始到部署ML模型结束),但他们往往会忘记ML生命周期的一个非常重要的特征,即模型漂移。模型漂移的本质是目标变量与自变量之间的关系随时间发生变化。由于这种漂移,模型变得不稳定,并且随着时间的推移,预测不断出错。漂移类型模型漂移可分为两类。第一个叫做“概念漂移”。当目标变量本身的统计属性发生变化时,就会发生这种情况。显然,如果我们试图预测的变量的含义发生了变化,那么模型将无法很好地适应这个更新后的定义。第二个也是最常见的一个是“数据漂移”。当预测变量的统计属性发生变化时,就会发生这种情况。同样,如果基础变量发生变化,模型必然会失败。发生这种情况的一个典型示例是数据中的模式因季节性而发生变化。任何在夏天行之有效的商业模式在冬天可能都行不通。航空公司在淡季期间努力维持客流量,即使假期期间航班需求激增。另一个例子是当个人的偏好发生变化时,他们的购物数据也会发生变化。如何解决?解决这个问题最好的办法就是不断的改装模型。根据过去的经验,可以估计模型漂移的开始。在此基础上,还可以重新开发机器学习模型,以降低漂移风险。对于数据随时间变化的情况,数据权重是一个不错的选择。例如,根据最近的交易,确定机器学习模型的一些特征,这些特征对最近的交易给予更多的权重而对过去的交易给予更少的权重。这不仅保证了机器学习模型的健壮性,也有助于避免与漂移相关的潜在问题。处理模型漂移的一种更复杂的方法是对变化本身进行建模。开发的第一个模型保持静态并用作基线。基于近期交易数据的行为变化,可以构建新的机器学习模型来纠正该基线模型的预测。模型应该多久重新训练一次?既然我们已经看到最常见的解决方案涉及对模型进行持续再训练,那么问题来了,这需要多久训练一次?对此有多种解决方案,每种解决方案因情况而异。虽然等待问题发生不是最好的方法,但它仍然是新模型的唯一选择。当出现问题时,可以调查出现的问题并进行修改,以防止将来出现此类问题。当模型涉及的实体数据是季节性模式时,模型应该根据季节重新训练。例如,随着节日期间支出的增加,机构需要建立特殊的模型来应对这种格局的突然变化。检测漂移的最佳方法是持续监测。需要在连续的时间间隔内监控与模型稳定性相关的指标。根据领域和业务的不同,此时间间隔可以是一周、一个月、一个季度等。监控模式可以是手动或自动脚本,当观察到突然的异常时应该触发警报和通知。最后,正如哲学家赫拉克利特的名言,“变化是唯一不变的”。准备好接受和监控这些变化的组织注定会成功。
