这里涉及到机器学习子领域的分类。对于所有的分类,首先要问的是为什么会这么划分?按什么维度?合乎逻辑的分类可以帮助人们建立认知结构,不合逻辑的分类会使人迷惑。一、机器学习是人工智能的一个子领域人工智能的一个子领域,随着历史的发展,具有更加突出的特点。大致可分为:1960年代开始的“推理期”:研究和搜索,结果包括自动定理证明,而象棋系统DeepBlue只能推理不能处理实际问题,需要广泛的知识。1970年代开始的“知识时代”,以基于知识的推理为主,结果包括Prolog、各种专家系统,以及今天的知识图谱,仅靠人工录入知识难以形成大规模应用。“学习期”始于1990年代末。该研究从数据中总结知识。结果包括当今的各种数据分析和挖掘系统。可见,“学习”是人工智能的一个大方向。根据TomMitchell的定义,“机器学习”来自于一种通过经验自动提高系统性能的程序。经验往往以数据的形式呈现,因此在实践中机器学习提供了数据分析的主要工具。也就是说,今天对数据的深入分析,对模型进行总结的工作,都属于机器学习的范畴。2.机器学习的任务分类机器学习从数据中总结出模型,数据所代表的经验可以包含不同的信息形式,其中一个关键信息就是关于模型性能的反馈信息。有些数据包含模型应该输出的值,有些数据根本没有这些信息,有些数据包含模型性能的评分。不同的反馈信息导致我们使用不同的技术进行处理。因此,根据不同的反馈信息,机器学习可以分为三类:监督学习:处理包含模型正确输出值的数据,即标记数据。例如,在图像识别数据中,每幅图像都有对应的分类标记。强化学习:处理后的数据只包含模型打分值,不知道模型应该输出什么,只能靠算法不断探索,找到打分值最高的模型输出。例如,围棋游戏缺乏对每一步棋的最佳指导,只能以最后的胜负作为评分,自主探索寻找最佳模型。无监督学习:绝对没有客观评估模型输出在数据中的好坏。这时候通常会人为设定某种学习目标来进行学习,比如将256维的人脸照片压缩成4维。目前还没有关于4个维度应该如何的信息。一种方法是使4维能够还原256维的人脸是一个人为的目标。这种恢复自我信息的方法也称为自监督学习。虽然名字中有“监督”,但它实际上是一种借用监督技术的无监督学习。可以看出,这个分类是按照机器学习的任务维度来划分的。当然,这样的划分并没有完全明确的界限。随着越来越多的跨领域研究工作的发展,衍生出很多方向:监督学习X无监督学习:比如数据中包含部分标记/部分标记数据,和未标记数据,研究如何使用未标记的数据来提高模型性能,这个领域叫做半监督学习,弱监督学习supervisedlearningXreinforcementlearning:比如围棋有一些人类专家的演示数据,利用这样的数据可以用来模仿人类使用监督学习的国际象棋移动,就像在初始版本的AlphaGo中使用的那样。这个领域叫做ImitationLearningReinforcementLearningXUnsupervisedLearning:比如强化学习任务在没有评分的情况下,算法自己探索环境,发现功能技能等。上面说的机器学习的子领域其实属于归纳学习,即从样本中归纳规律。由于其广泛的适用性,归纳学习成为“默认机器学习”。然而,实际上还有另一种机器学习,演绎学习,它通过推断新知识来学习。由于数据分析的流行,这个方向一直没有受到重视,但近年来,随着符号人工智能的复兴,它也在不断壮大。3.机器学习的模型分类在早期的机器学习研究中,从不同的启发思想中产生了不同的模型,包括:最近邻模型、决策树模型、贝叶斯模型、线性模型、多层神经网络模型等。早期的研究重点on对于数据量小、语义层次高的数据,比如用户购买的商品数据,一个商品ID对应一个商品。对于语义层次较低的数据,如图像数据,则用每个像素的灰度值来表示。识别图像中的人脸,需要在灰度值和人名之间建立联系,跨度很大;一个词需要建立声波强度与词之间的一系列联系,跨度巨大,因此获得的性能有限,往往需要依赖人为构建的高层特征,如灰度直方图人脸图像的投影。2012年,具有一定结构的多层神经网络模型,结合大量数据,在语音识别和图像识别方面取得性能突破,引起广泛关注。语音数据所体现的优势越来越明显。为了区别于传统模型,使用这种深度神经网络模型的方法称为深度学习。它的特点是,不同于特征工程+传统模型,深度模型直接从低层语义数据中学习上层任务,也就是所谓的“端到端”学习,自动包含数据的表征学习。相反,包含表示学习的模型通常需要多级处理,也可以称为深度学习。除了深度神经网络,还有深度森林等非神经网络模型。机器学习的任务和模型可以组合,即有非深度/深度监督学习、非深度/深度强化学习、非深度/深度无监督学习等。
