机器学习是人工智能(AI)的一个子集。它专注于训练计算机从数据中学习并根据经验进行改进,而不是明确地编程来这样做。在机器学习中,算法经过训练可以在大型数据集中查找模式和相关性,并根据该分析做出最佳决策和预测。机器学习应用程序会随着使用而改进,并且它们访问的数据越多,就越准确。机器学习的应用无处不在——在我们的家中、我们的购物车、我们的娱乐媒体和我们的医疗保健中。人工智能与机器学习关系图什么是神经网络?人工神经网络(ANN)建立在生物大脑中的神经元之上。人工神经元被称为节点,它们分层组合在一起并并行运行。当人工神经元接收到数字信号时,它会对其进行处理并将信号发送到与其相连的其他神经元。就像在人脑中一样,神经强化可以改善模式识别、专业知识和整体学习。什么是深度学习?这种机器学习被称为“深度学习”,因为它包括许多层的神经网络和大量复杂而分散的数据。为了实现深度学习,该系统与网络中的多个层一起工作以提取越来越高级的输出。例如,用于处理自然图像和寻找嘉兰菊的深度学习系统将在第一级识别植物。当它穿过神经层时,它会识别花朵,然后是雏菊,最后是嘉兰菊。深度学习应用的示例包括语音识别、图像分类和药物分析。机器学习是如何工作的?机器学习由使用各种算法技术的不同类型的机器学习模型组成。根据数据的性质和期望的结果,可以使用四种学习模型之一:监督、非监督、半监督或增强。在每个模型中,可以根据使用的数据集和预期结果应用一种或多种算法技术。机器学习算法的基本目的是对事物进行分类、发现模式、预测结果并做出明智的决策。当涉及复杂且更不可预测的数据时,可以一次使用一种算法或组合使用算法以达到最佳准确性。机器学习过程如何工作什么是监督学习?监督学习是四种机器学习模型中的第一种。在监督学习算法中,机器通过示例进行教学。监督学习模型由“输入”和“输出”数据对组成,其中输出标有期望值。例如,假设目标是让机器区分雏菊和三色堇。二进制输入数据对由雏菊图像和三色堇图像组成。该特定对的期望结果是选择雏菊,因此它将被预先确定为正确的结果。通过一种算法,系统随着时间的推移编译所有这些训练数据,并开始识别相关的相似点、不同点和其他逻辑点——直到它可以完全自己预测雏菊或三色堇问题的答案。这相当于给孩子一个解答一系列问题的答案,然后让他们展示自己的作品并解释他们的逻辑。监督学习模型用于我们日常交互的许多应用程序,例如产品推荐引擎和Waze等交通分析应用程序,它们可以预测一天中不同时间的最快路线。什么是无监督学习?无监督学习是四种机器学习模型中的第二种。在无监督学习模型中,没有答案键。机器研究传入的数据(其中许多是未标记和非结构化的)并开始使用所有相关的可访问数据来识别模式和相关性。在许多方面,无监督学习都以人类观察世界的方式为模型。我们用直觉和经验把东西放在一起。随着我们遇到的事物的例子越来越多,我们对事物进行分类和识别的能力也越来越准确。对于机器来说,“经验”是由数据输入量和可用数据量来定义的。无监督学习应用的常见示例包括面部识别、基因序列分析、市场研究和网络安全。什么是半监督学习?半监督学习是四种机器学习模型中的第三种。理想情况下,所有数据在输入系统之前都将被结构化和标记。但这显然是不可行的,所以当存在大量原始的、非结构化的数据时,半监督学习成为一种可行的解决方案。该模型涉及输入少量标记数据以扩充未标记数据集。从本质上讲,标记数据是系统工作的基础,可以大大提高学习速度和准确性。半监督学习算法指示机器分析标记数据的相关属性,以便将它们应用于未标记数据。然而,正如麻省理工学院出版社的这篇研究论文所深入探讨的那样,该模型存在风险,系统会学习和复制标记数据中的缺陷。使用半监督学习最成功的公司,确保他们有最佳实践协议。半监督学习用于语音和语言分析、复杂的医学研究(如蛋白质分类)和高级欺诈检测。什么是强化学习?强化学习是第四种机器学习模型。在监督学习中,机器被赋予一个答案键,并通过寻找所有正确结果之间的相关性来学习。强化学习模型不包括答案键,而是输入一组允许的动作、规则和潜在的最终状态。当算法的预期目标是固定的或二元的时,机器可以通过示例进行学习。然而,在期望结果可变的情况下,系统必须通过经验和奖励来学习。在强化学习模型中,“奖励”是数字,并作为系统寻求收集的内容被编程到算法中。在许多方面,该模型类似于教某人如何下棋。当然,不可能尝试向他们展示所有可能的动作。相反,您解释规则,他们通过练习培养技能。奖励不仅以赢得比赛的形式出现,而且还以获得对手棋子的形式出现。强化学习的应用包括在线广告、电脑游戏开发和高风险股票市场交易中为买家自动竞价。机器学习挑战数据科学家和哈佛毕业生TylerVigan在他的书《虚假关联》中指出:“并非所有关联都表明潜在的因果关系。”为了说明这一点,他提供了一张图表,显示缅因州人造黄油消费与离婚率之间的明显相关性。当然,这张图表是为了说明一个幽默点。但是,更重要的是,机器学习应用程序容易受到人为和算法偏差和错误的影响。而且由于其学习和适应的倾向,错误和虚假的相关性可以在整个神经网络中快速传播和污染结果。
