Topenddatatecdat:避开数据海洋的“暗礁”:识别异常用户行为大多数情况下,这些数据告诉我们用户行为的常见模式。数据的异常变化可能是我们系统出现故障或用户流失的“症结”。如何在数据的海洋中识别“礁石”,是异常用户行为分析需要探索的问题。▼▍什么是异常检测?异常检测是在数据中发现不符合“正常”的行为模式的过程。在时间序列数据中检测出偏离预期行为的数据对于保证系统的正常运行至关重要。一般来说,异常可以分为两种:▍全局异常/局部异常局部异常很多时候我们可以看到数据的底层趋势,它看起来像一个“波浪”:早上活跃度低,白天活跃度高,而晚上高很低。这种情况下会出现局部异常。例如:夜间高活动意味着异常。全球异常这是我们最熟悉的一种异常。这是平时随机出现的异象。一般使用95%分位数即可检测。▍异常检测方法我们使用历史数据来构建对每个监控数据的估计。将实时数据与这些值进行比较并分配一个分数。根据对近期数据的观察得到的阈值来判断实时数据是否异常。这种方法的优点是阈值不是静态的,而是实时的。检测场景:tecdat的解决方案从收集网站的行为数据开始。分别总结了测量趋势的三个主要组成部分,即固定趋势、周期趋势和季节性数据。该算法发现数据中的异常并向用户发送自动实时警报。通过实时的异常数据监控,可以清楚地看到网站流量的差异,在出现异常情况时快速排查和修复,减少网站宕机时间,减少潜在客户的流失。
