当前位置: 首页 > 科技观察

机器学习四种不同类别的概述

时间:2023-03-17 13:57:50 科技观察

我们可以根据算法如何进行学习将其分为以下不同类别:监督学习无监督学习半监督学习强化学习01监督学习监督学习是当前的业务流程The最常见的机器学习形式。这些算法试图找到映射输入和输出的函数的良好近似值。为此,顾名思义,我们需要自己为算法提供输入和输出值,并尝试找到一个函数,使预测值和实际输出值之间的误差最小。学习阶段称为训练。训练模型后,它可以预测未见数据的输出。这个阶段通常被视为评分或预测,如图1-1所示。▲图1-102无监督学习无监督学习是针对未标记的数据进行的,所以我们不需要实际的输出值,只需要输入。它试图在数据中找到模式并根据这些共同属性做出反应,将输入分成许多不同的集群(如图1-2所示)。▲图1-2一般来说,无监督学习常与监督学习结合使用,以减少输入空间,将数据中的信号集中在较少数量的变量上,但无监督学习还有其他目标。从这个角度来看,当标记数据昂贵或不太可靠时,无监督学习比监督学习更适用。常见的无监督学习技术包括聚类和主成分分析(PrincipalComponentAnalysis,PCA)、独立成分分析(IndependentComponentAnalysis,ICA),以及一些神经网络,例如生成对抗网络(GAN)和自编码器(Autoencoder,AE)。03半监督学习半监督学习是一种介于监督学习和无监督学习之间的技术。它可以说不是机器学习中的一个单独类别,而只是监督学习的概括,但在这里将其单独列出是有用的。其目的是通过将一些标记数据扩展到类似的未标记数据来降低收集标记数据的成本。我们将一些生成模型归类为半监督学习。半监督学习可以分为转导学习和归纳学习。转导学习适用于为未标记数据推断标签,归纳学习适用于推断从输入到输出的正确映射。我们可以看到这个过程与我们在学校学到的大部分内容相似。老师向学生展示了一些示例,然后让学生回家完成作业。要完成这些工作,他们需要进行概括。04强化学习强化学习(RL)是迄今为止我们所见过的最独特的类别。这个概念很有趣:该算法试图找出一种使奖励总和最大化的策略。该策略由代理学习,使用它在环境中执行操作。然后环境返回反馈,代理使用这些反馈来改进其策略。反馈是对所执行操作的奖励,可以是正的、空的或负的,如图1-3所示。▲图1-3