机器学习有四种广泛认可的形式:监督、无监督、半监督和强化。这些形式在研究文献中进行了深入探讨。它们也被纳入大多数机器学习算法的入门课程。下表总结了四种形式。但一个鲜为人知的概念是机器学习策略,它以创造性的方式应用基本的机器学习算法来解决现实世界的问题。我对这些策略产生了浓厚的兴趣。在这篇文章中,我将探索四种策略:在线学习、迁移学习、集成学习和深度学习。幸运的是,这四种策略适用于表中任何形式的机器学习。1.在线学习在线学习使用快速变化的数据。这种类型的模型随数据及时更新,不存储以前的数据。一些在线学习算法也会“适应”,即随时调整模型以跟随或跟踪数据的变化。具体来说,它们会逐渐“忘记”过时的数据,使其适用于环境/模型随时间变化的应用程序。批量(或离线)学习使用静态数据,可以作为在线学习的热身。在批量学习中,模型一次从所有数据中学习。许多在线学习算法使用批处理/离线算法(基于小批量数据)在开始之前预热模型。这种方法可以显着加快算法的收敛速度。2.迁移学习迁移学习将知识从一个领域应用到另一个领域。它重新利用旧数据、模型和参数来解决新问题,对于机器学习模型的终身学习至关重要。迁移学习是人类与生俱来的能力。例如,我们会将掌握的语言知识(词汇、语法等)应用到一门新语言的学习中。两种语言越接近,知识传递就越容易。3.Integratedlearningsinglelearner模型只使用一个learner(算法),而integratedlearning使用多个learner。常见的集成算法包括梯度提升、引导聚合、决策森林、堆栈集成和超级学习器。集成学习可以结合相对较弱(在许多情况下,只比随机猜测略好)的学习者来产生强大、准确的模型。4.深度学习深度学习由多层组成,可以学习数据的层次或多尺度特征。相反的是“浅层学习”,它只是简单地应用常见的机器学习建模算法。通常,浅层学习离不开特征工程,以确保输入以适当的形式呈现给模型,而深度学习在训练过程中自然地学习这些特征。机器学习策略是我们在使用机器学习算法解决日常业务问题时需要考虑的另一个方面。
