今天给大家分享一个在数据分析过程中费率指标分析可能犯的错误。其实很多新人都会做这个题,有的老手也会做,而且很多时候做错了还不知道。正好有读者问类似的问题,所以写一篇文章分享一下。我们先来看一个例子。下面是XXX公司各个渠道的留存率。现在,如果要查看公司的总保留率,应该如何计算?直觉上应该有两种算法。第一种算法是用每个频道的留存用户数÷每个频道的新注册用户数。第二种算法是直接计算三个渠道的留存率的平均值。那么这两种算法有什么区别呢?计算结果有何不同?如果用这两种算法计算上表中的数字,计算出来的结果是不一样的。那么哪个是正确的呢?如果你通常使用第一种算法,那么恭喜你,你的做法是正确的,但是第二种算法有什么问题呢?这是因为不同渠道的新注册用户数量不同,所以对最终结果的影响程度也不同。如果你直接对三个渠道的留存率进行平均,也就是你假设这三个渠道最后对整体留存的影响是一样的,但显然不一样。那么第三种算法就来了,也就是:试着算一下,第三种算法计算出的结果和第一种算法计算出的结果是一样的。那么如果不同渠道的新注册用户数是一样的,比如下表,这时候上面三种不同算法计算出来的结果是一样的。以上是利率指标分析中常犯的错误。事实上,上述情况不仅仅适用于利率指标。准确的说,它应该适用于所有需要按组划分的情况,比如每个班级的平均分与年级总平均分之间的关??系。我希望对你有用。
