当前位置: 首页 > 科技观察

监督学习还是无监督学习?这个问题必须搞清楚

时间:2023-03-21 17:58:17 科技观察

本文转载自公众号《阅读芯》(ID:AI_Discovery)当你踏上机器学习的征程,搞清楚监督学习和无监督学习是你首先要做的事.对于新手,“有监督学习和无监督学习有什么区别?”是最常见的问题。答案在于理解机器学习算法的本质。如果不弄清楚有监督学习和无监督学习之间的区别,您的学习之旅将是不可能的。如果sSDBQIF不了解线性回归、逻辑回归、聚类、神经网络等算法的适用范围,则无法直接进入模型构建阶段。如果不知道机器学习算法的目标是什么,就不可能建立准确的模型。这就是监督学习和无监督学习的用武之地。本文将帮助您解决这个问题,并为您提供另一个关键问题:如何决定何时使用监督学习或无监督学习?什么是监督学习?在监督学习中,计算机从示例中学习。它从过去的数据中学习并将学习应用于当前数据以预测未来事件。在这种情况下,输入数据和预期输出数据都有助于预测未来事件。为了准确预测,输入数据被标记为正确答案。监督机器学习的分类重要的是要记住,所有监督学习算法本质上都是复杂的算法,分类为分类或回归模型。回归模型——回归模型用于输出变量为实数值的问题,例如单个数字、美元、薪水、体重或压力。它最常用于根据先前的观察来预测值。一些更常见的回归算法包括线性回归、逻辑回归、多项式回归和岭回归。分类模型——分类模型用于对输出变量进行分类,例如“是”或“否”、“通过”或“失败”。分类模型用于预测数据的类别。现实生活中的例子包括垃圾邮件检测、情绪分析、考试记分卡预测等。监督学习算法在现实生活中有一些非常实际的应用,包括:文本分类垃圾邮件检测天气预报根据当前市场价格预测房价股票价格预测等.人脸识别签名识别客户发现什么是无监督学习?无监督学习是一种使用既未分类也未标记的数据来训练机器的方法。这意味着没有提供训练数据,机器只能自己学习。机器必须能够在不提供有关数据的任何先验信息的情况下对数据进行分类。这个想法是首先让计算机接触大量不断变化的数据,并允许它从这些数据中学习,以提供以前未知的见解并识别隐藏的模式。因此,无监督学习算法不一定有明确的结果。相反,它会识别给定数据集中的不同之处或有趣之处。需要对计算机进行编程以自学。计算机需要理解结构化和非结构化数据并提供见解。以下是对无监督学习的准确描述:无监督机器学习分类聚类是最常见的无监督学习方法之一。聚类方法涉及将未标记的数据组织成类似的组,称为聚类。因此,集群是相似数据项的集合。这里的主要目标是发现数据点之间的相似性并将相似的数据点分组到一个集群中。异常检测是识别与大多数数据显着不同的特殊项目、事件或观察结果的方法。在数据中寻找异常或离群值的原因通常是它们可疑。异常检测通常用于银行欺诈和医疗错误检测。无监督学习算法的应用无监督学习算法的一些实际应用包括:恶意软件检测识别数据输入过程中的人为错误执行准确的购物篮分析等欺诈检测我应该何时选择有监督或无监督学习?在制造业中,有许多因素会影响哪种机器学习方法最适合任何给定任务。此外,由于每个机器学习问题的独特性,决定使用哪种技术是一个复杂的过程。一般来说,选择正确机器学习方法的一个好策略是:评估数据。贴还是不贴?是否有专业知识支持附加标签?这将有助于确定是否应使用有监督、无监督、半监督或强化学习方法。查看可能适用于维度问题(特征、属性或特征的数量)的可用算法。候选算法应该适合整个数据量及其结构。研究有关应用于类似问题的算法类型的成功案例。定义目标。定义的问题是否再次出现?你期望算法预测新问题吗?监督学习和非监督学习是机器学习领域的关键概念。这应该是您开始学习机器学习的第一课。一定要看透它!