吐血整理：人工智能和机器学习领域的13个常见概念

时间：2023-03-14 23:53:15 科技观察

01人工智能阿兰图灵（AlanTuring）对人工智能的定义如下：如果幕后有一台机器，并且有人正在与它交互（不管以什么方式，比如音频或者打字等），如果人觉得他在和另一个人互动，那么机器就是人工智能。这是定义人工智能的一种非常独特的方式。它不直接涉及智能的概念，而是关注类人行为。事实上，这个目标的范围甚至比单纯的情报更广泛。从这个角度来看，人工智能并不意味着建造一台可以瞬间解决任何问题的超级智能机器，而是建造一台可以模仿人类行为的机器。然而，仅仅建造模仿人类的机器听起来并不怎么有趣。从现代的角度来看，每当我们谈到人工智能时，我们指的是能够执行以下一项或多项任务的机器：理解人类语言、执行涉及复杂操作的机械任务、基于计算机的复杂问题以及大量数据的响应以类似人类的方式回答等等。电影《2001：太空漫游》中描述的超级计算机HAL，非常接近现代AI的观点。它是一种机器，能够处理来自各种来源的大量数据，以极快的速度生成见解和摘要，并以类似人类的交互方式（例如语音对话）将这些结果传达给人类。从类人行为的角度来看，人工智能有两个方面。一方面，机器是智能的，能够与人类交流，但没有任何运动功能。HAL是此类人工智能的一个例子。另一方面，涉及与机器人领域涉及的类人运动能力的物理交互。02机器学习术语“机器学习”或简称ML（机器学习）是由ArthurSamuel于1959年在用机器解决西洋跳棋游戏的背景下创造的。该术语指的是一种计算机程序，它可以学习产生一种行为，而这种行为并未明确编程为程序作者要实现的行为。相反，它能够揭示作者可能根本不知道的行为。这种行为的学习基于三个因素：程序消耗的数据；量化错误或当前行为与理想行为之间某种形式的距离的度量；一种反馈机制，它使用量化的错误来指导程序在后续事件中产生更好的行为。可以看出，第二个和第三个因素快速抽象概念并强调其深厚的数学根源。机器学习理论中的方法对于构建人工智能系统至关重要。机器学习算法大致分为三种：监督学习算法非监督学习算法强化学习算法。让我们详细了解每种类型。03监督学习为简单起见，让我们将机器学习系统想象成一个黑盒子，在给定一些输入时会产生一些输出。如果我们已经有了包含一组输入的一组输出的历史数据，那么基于这些数据的学习就称为监督学习。监督学习的一个典型例子是分类。假设我们测量了3种不同类型的花（IrisSetosa、IrisVersicolor、IrisVirginica）的4种不同属性（头皮长度、平板宽度、花瓣长度和花瓣宽度）。我们测量了每朵花的25个不同的例子。然后，这些数据将用作训练数据，其中有可用于训练模型的输入（4个测量属性）和相应的输出（花的类型）。然后以监督方式训练合适的机器学习模型。训练模型后，它可以根据萼片和花瓣的大小对任何花朵（在三种已知类型之间）进行分类。04无监督学习在无监督学习范式中，没有标注数据。无监督学习的一个经典例子是“聚类”。考虑上一节中描述的相同示例，我们在其中对三种花朵的萼片和花瓣尺寸进行了测量。然而，在这种情况下，我们没有每组测量的花朵的确切名称。我们所拥有的只是一组测量值。此外，我们被告知这些测量值属于三种不同类型的花。在这种情况下，可以使用无监督学习技术自动识别三组测量值的聚类。然而，由于标签未知，我们所能做的就是将每个簇称为flower-type-1、flower-type-2和flower-type-3。给定一组新的测量值，我们可以找到它们最近的集群并将它们归类为其中一个。05强化学习强化学习是一种特殊的学习方法，需要区别于有监督和无监督的方法。强化学习涉及到来自环境的反馈，所以它不是完全无监督的，但是，它也没有一组可用于训练的标记样本，因此不能被认为是有监督的。在强化学习方法中，系统不断地与环境交互以寻求产生所需的行为并从环境中获得反馈。06静态学习另一种对机器学习方法进行分类的方法是根据它们处理的数据类型。接收静态标记数据的系统称为静态学习方法。处理随时间变化的数据的系统称为动态方法。每种方法都可以是有监督的或无监督的，但是，强化学习方法始终是动态的。静态学习是指对作为单个快照拍摄的数据进行学习，并且数据的属性随时间保持不变。一旦模型在数据上进行了训练（使用有监督或无监督学习），经过训练的模型可以在未来的任何时间应用于类似的数据，并且它仍然有效并且将按预期执行。一个典型的例子是不同动物的图像分类。07动态学习这也称为基于时间序列的学习。这类问题中的数据是时间敏感的，会随着时间的推移而变化。因此，模型训练不是一个静态的过程，而是模型需要持续训练（或在每个合理的时间窗口之后）才能保持有效。此类问题的典型示例是天气预报或股票市场预测。一年前训练的模型对于预测明天的天气或预测明天任何股票的价格将完全无用。这两种类型之间的根本区别在于状态的概念。在静态模型中，模型的状态是恒定的，而在动态模型中，模型的状态是时间的函数，它是不断变化的。08维度在处理各种数据集时，维度通常是一个令人困惑的概念。从物理的角度来看，尺寸是空间尺寸：长度、宽度和高度。（为简单起见，我们深入研究物理学，没有将时间视为第四维。）在任何现实生活场景中，我们遇到的不过是这三个维度。然而，当我们为机器学习处理数据时，往往有几十个、几百个，甚至更多的维度。要理解这些高维度，我们需要研究维度的基本属性。空间维度被定义为使得每个维度与其他两个维度垂直或正交。这种正交性对于3D空间中的所有点具有唯一表示至关重要。如果维度不是相互正交的，空间中的同一个点可以有多种表示，并且基于此的整个数学将失败。比如我们设置长宽高三个坐标，原点任意（原点的具体位置只是改变坐标值，不影响唯一性，只要始终保持不变即可计算可以选择任何原点。）坐标(0,0,0)标记原点本身的位置。坐标（1,1,1）将标记一个点空间，该点空间在每个维度上距离原点1个单位并且是唯一的。没有其他坐标系可以表示空间中的相同位置。现在，让我们将这个概念扩展到更高的维度。在数学上添加更多维度相对容易，但很难在空间上可视化。如果我们添加第四个维度，它必须与之前的所有三个维度正交。在这样的四维空间中，原点坐标为（0,0,0,0）。3D空间中的点(1,1,1)在4D空间中可以有坐标(1,1,1,0)。只要保证正交性，就可以保证坐标的唯一性。同样，我们可以有任意数量的维度，所有数学仍然成立。考虑前面描述的虹膜数据示例。输入有4个特征：萼片和花瓣的长度和宽度。由于这4个特征是相互独立的，因此可以认为它们是正交的。因此，在解决鸢尾花数据问题时，我们实际上是在处理一个四维输入空间。09维度的诅咒尽管从数学的角度来看可以添加任意数量的维度，但仍然存在一个问题。随着维度的增加，数据的密度呈指数下降。例如，如果我们在训练数据中有1000个数据点，并且该数据具有3个独特的特征。假设所有特征的值都在1到10之间。所有这1000个数据点位于一个大小为10x10x10的立方体中。因此密度为1000/1000或每单位立方体1个样本。使用5个而不是3个独特的特征，数据的密度迅速下降到每单位5D立方体0.01个样本。数据的密度很重要，因为数据的密度越高，找到好的模型的可能性就越大，对模型准确性的置信度就越高。如果密度很低，那么在该数据上训练的模型的置信度就会很低。因此，尽管高维度在数学上是可以接受的，但需要注意维度，以便能够开发出具有高置信度的良好机器学习模型。10奥卡姆剃刀原则在开发和应用机器学习模型时，总是有多种可能的解决方案和多种可能的方法来得出答案。很多时候没有关于哪种解决方案或哪种方法比另一种更好的理论指导。在这种情况下，可以有效地应用奥卡姆剃刀的概念（有时称为简约原则）。该原则指出：不应做出超出最低要求的假设，或者换句话说，当解决方案有多种选择时，最简单的就是最好的。这个原则不完全是一个定理，不能作为定量规则或方程式应用。然而，在现实生活中做出此类决定时，它是一个强大而有效的概念指南。另请注意，此规则会产生折衷，一方面我们以复杂形式获得更多信息，而另一方面以简单形式获得更少信息。不应将问题过于简单化，以致丢失一些核心信息。奥卡姆剃刀的另一个派生方面是，更简单的解决方案往往概括得更多。11“没有免费的午餐”定理设计机器学习系统时要注意的另一个有趣概念来自Wolpert和Macready的论文，形式为“没有免费的午餐”定理或优化中的NFL定理。该定理本质上表明，如果一种算法在一类问题上表现更好，那么它会以在其他类问题上性能下降的形式得到回报。换句话说，您不可能对所有类型的问题都有单一的最佳解决方案。这个定理需要更多地用作指南而不是法律，因为设计良好的算法完全有可能在所有可能的问题类别中胜过其他设计不佳的算法。然而，在实际情况下，从这个定理可以推断出，我们不能对所有问题应用相同的解决方案并期望它在所有情况下都能很好地工作。12收益递减规律收益递减规律经常出现在经济和商业场景中。它指出，随着现有员工数量的增加，增加更多员工来完成一项工作所产生的收益会越来越少。从机器学习的角度来看，这个规则可以应用于特征工程。从给定的数据集中，只能提取一定数量的特征，之后性能增益开始减少，不值得付出努力。在某些方面，它符合奥卡姆剃刀原则并增加了更多细节。13专家系统在机器学习真正商业化之前，很少有其他系统突破传统计算的界限。一个值得注意的应用是专家系统。艾伦·图灵的定义标志着一个时代的开始，机器智能得到认可，人工智能领域由此诞生。然而，在早期（直到1980年代），机器智能或机器学习领域仅限于所谓的专家系统或基于知识的系统。专家系统领域的领先专家之一爱德华费根鲍姆博士曾将专家系统定义为：一种智能计算机程序，它使用知识和推理过程来解决非常棘手的问题，这些问题需要大量的人类专业知识.这样的系统可以替代某些领域的专家。这些机器被编程为根据复杂的逻辑操作执行复杂的启发式任务。虽然这些系统能够取代特定领域的专家，但如果我们将它们与人类智能进行比较，它们并不是真正的“智能”系统。原因是系统是“硬编码”的，只能解决某一类问题，如果需要解决一个更简单但完全不同的问题，这些系统很快就会变得毫无用处。尽管如此，这些系统还是非常受欢迎和成功，特别是在需要可重复但高精度性能的领域，例如诊断、检查、监测和控制。关于作者：AmeetV.Joshi博士，目前是Microsoft的数据科学经理。他获得了博士学位。2006年从密歇根州立大学毕业。他在各种不同工业领域的机器学习算法开发方面拥有超过15年的经验，包括管道检查、家庭能源故障、MicrosoftCortana智能和CRM中的商业智能。

上一篇：如何配置Windows沙盒设置？

下一篇：使用分布式数据库后，性能提升了50%，为什么还放弃？

吐血整理：人工智能和机器学习领域的13个常见概念相关文章