数据科学关注的是发现隐藏在噪音中的信号。这说起来容易做起来难,但它可以在不依赖数据专家大军的情况下实现。对于那些想自己使用基本统计技术的人来说,本文中描述的定量分析技术是入门的好方法(链接中的附加信息)。从本质上讲,该过程可以概括为以下四个步骤: 1。观察:移动用户数据的趋势可能会提供一些无法预料的见解,以帮助更好地了解用户使用应用程序的方式、时间和地点以及原因。这些见解具有潜在价值,可用于做出后续决策以优化用户体验。 2.形成假设框架:当无法获得所有信息时,需要进行归纳推理。这对于移动应用程序来说显然是正确的,因为您的目标受众不可能挤在一起等待您采访他们。 3.数据采集??:判断假设的挑战是确定对相关任务有帮助的可用证据。在我看来,这需要在考虑机器学习算法的细节之前做好。 4.AssessingHypothesis:生成模型的出发点是进一步解释数据。接下来,根据模型对当前观察到的数据的解释程度来评估模型的可信度。 做出高质量且可操作的决策 数据科学可以被描述为业务假设与其实际运作方式之间的竞争。与Countly合作将使您能够访问完整的移动用户行为数据集和一整套数据可视化工具。定量分析需要使用完整的移动用户行为数据集,而不是使用可能会在分析中引入不确定偏差的采样技术来分析收集到的数据。只需点击几下,您就可以可视化有关用户的各种详细信息。例如,Countly可用于以多种语言快速可视化应用程序用户的原始数据和百分比数据(见下图)。这种方法比Excel更直观,并且无需额外导出原始数据以进行常规数据分析,从而节省了团队时间。此外,Countly还可以灵活整合来自其他来源的移动数据和人口统计数据,例如银行可能需要整合来自后台的数据(年龄、预估收入、婚姻状况、近期大额交易记录、近期地址变更等))以便Countly可以更好地了解应用程序内的用户行为,并通过特定的推送通知促进微定位。这样,数据分析才能更有针对性,更贴合业务需求。 为了帮助您在激动人心的数据驱动领域茁壮成长,您需要扩展您对成功的定义:“成功”对您意味着什么?这个问题并不像看起来那么简单。你的优先事项是什么?如果您的重点是应用内购买,那么您的目标就是收入和用户生命周期价值(LTV)。对于大多数不以货币化为中心的其他应用程序,主要问题可能是用户保留。 那么,现在我们开始看数据。借助Countly,您可以访问100%的应用程序用户数据,并可以深入查看高度参与的用户(假设您运行健身应用程序并选择保留作为成功指标)以及这些用户在注册时采取的操作。观察高参与度用户行为模式,然后进行定量访谈以确定您的应用程序最令人兴奋的功能。然后,您的团队可以捕获有助于在下载应用程序的前10天内提高保留率的行动的关键假设: 1。完成3项推荐的锻炼2。在社区发布5条信息 3.Follow5Ahealthydiet 我们为每个操作定义队列,然后对样本数据使用二进制分类测试来比较每个组在注册2个月后的用户保留表现。然后我们可以查看每个测试的阳性和阴性预测值(定义如下),并确定我们正在寻找的临界阈值。 测试1:用户是否在前10天内完成了≥3个推荐的练习? 测试2:用户是否在前10天内在社区发布了≥5条信息? 测试3:用户前10天关注社区≥5次健康餐? 完成3项推荐的锻炼显然是胜利。因此,该练习对2个月的保留率具有更高的阳性预测值;相反,完成少于3次练习具有更高的阴性预测值。该测试可以很好地预测2个月的留存率:达到标准,保留该应用程序的可能性为99%;错过目标,95%的机会失去用户。 发布5条信息并遵循5条健康饮食与保留率密切相关(因此具有很高的阳性预测值),但不符合关键条件标准。不采取这些行动的用户在2个月后仍有很高的机会保留该应用程序。 到目前为止,完成推荐的运动似乎是关键的门槛。另一个需要评估的重要点是让用户完成一个动作的价值。换句话说,让用户完成3项推荐的锻炼以增加2个月后在应用程序上的保留的成本。在分析数字时,完成3项推荐的锻炼会在2个月后将留存率提高约20倍,而发布5次更新和遵循5顿健康膳食甚至留存率都不会翻倍(分别为1.3倍和1.1倍)。你可以通过回归分析得出这个结论,但是时间太长了。有关更多信息,我建议阅读此URL。数据分析结果表明,鼓励用户完成推荐的3项锻炼是值得的。发布5条信息和遵循5条健康饮食与保留率密切相关(因此具有很高的阳性预测值),但不符合关键条件标准。不采取这些行动的用户在2个月后仍有很高的机会保留该应用程序。 如果您对机器学习和更复杂的模型感兴趣,我建议使用R实现非结构化数据的K-Means聚类。这种技术提供了另一种方法来识别与业务目标相关的特定集群,例如3个月保留。根据指定的标准将观察结果分为K组,然后重新分组到最密切相关的集群中(请参见下面的示例)。 K-均值聚类比层次聚类可以处理更大的数据集。此外,观测值不会永久固定在一个集群中。在分析时,观察结果会发生变化,从而改善整体结果。要了解有关K-means聚类的更多信息,我建议阅读《R 语言实战》作者RobKabacoff的这篇文章。 Keepitsimple 错误最少的通用模型最有可能准确预测未来的观察——奥卡姆剃刀。确定临界阈值时的两个重要考虑因素:保持稳定和简洁。如果涉及太多不同的行为,将难以衡量并且可能会随着时间的推移而改变。它还会分散团队的注意力——这会引导我们进行下一步。采取行动 既然您已经确定了关键指标——为了提高用户满意度和参与度必须克服的阈值——应该采取相应的行动。印度领先的在线广告效果管理公司Sokrati在节日期间成功推出了为期2-3天的Facebook活动,为珠宝品牌赢得了超过300%的销售额增长。他们的策略包括三个步骤: 关键是利用假期来瞄准并鼓励更多用户尽快行动。深入挖掘不同的受众群体以扩大您的受众群体,您会发现参与度和保留率都在上升。我希望这些概念和结构对你有所帮助。欢迎您联系Countly,继续讨论和分享您自己的故事! 作者简介 陈俊勋是Countly中国及亚太区营销经理。同时,他正在新加坡南洋理工大学攻读兼职消费者洞察和营销硕士学位。他喜欢移动分析、咖啡和英超联赛。欢迎联系Countly和Sokrati(hello@count.ly)。Countly为移动和网络应用程序提供高级分析和营销。我们非常重视开源软件和50多个开源库、SDK和框架。我们提供开源SDK和整个后端,包括服务器端组件和仪表板。
