当前位置: 首页 > 科技观察

用机器学习备忘单解决棘手问题,你能做到吗?

时间:2023-03-17 12:38:49 科技观察

无论你是机器学习的初学者还是中级程序员,你都可能被这个问题搞糊涂了。如何建立备忘单?你能从这篇文章中学到什么?在机器学习中,没有万能的解决方案。由于算法种类繁多,因此很难找到解决问题的正确算法。但别担心,在本文中,我们将解释如何使用备忘单简化机器学习方法,您可以使用备忘单为您的问题选择正确的算法。这是备忘单-您需要了解的有关机器学习的技巧。备忘单使用指南选择算法时要考虑的因素有几个因素会影响您的选择。有些问题比较特殊,需要特殊的方法来解决。例如,推荐系统可以用来解决此类问题。虽然某些类型的问题是开放式的,但它们需要反复试验和故障排除。监督学习、分类和回归是解决公开课问题的方法。您希望对数据执行什么操作-分类、回归或聚类?大小:选择算法时,数据集的大小(无论大小)很重要。质量:数据集中有多少变化,数据集是否平衡。数据性质:我们是否标记了数据?模型的输入和输出如何表示?时间可用性:您需要花费多少时间来构建和训练模型。有些模型可以构建得更快,但准确性较低。速度或精度:您可能对生产就绪模型的精度要求很高,但有时您只需要一个计算速度更快的快速工作模型。要使用备忘单,只需查看图表上的选择选项卡并移动到回答问题的箭头。例如:如果你想减少维数并且不需要主题建模,使用PCA。如果你想预测一个变量的值并且需要高精度,你应该尝试随机森林、神经网络或梯度提升树。如果你有未标记的数据并且想进行聚类,你可以使用k-最近邻聚类算法。选择正确的算法值得一提的是,即使是经验丰富的数据科学家也无法在不尝试其他算法的情况下判断出哪种算法效果最好。条条大路通罗马,这份备忘单可能不是解决问题的唯一方法。此备忘单仅旨在指导您根据已知因素使用哪些算法。机器学习算法的种类来源:zhihu1。监督学习监督学习算法是对操作的直接监督。我们使用数据来教授或训练机器,这意味着数据标有正确答案。使用算法分析训练数据并获得将输入映射到输出的函数。然后可以从训练数据中概括该函数以预测未知输入的输出。监督学习主要用于以下两类问题。分类:在分类问题中,您需要找到输入数据的类别。例如,将图像分类为“狗”或“猫”。回归:在回归问题中,输出是实数值的。尝试根据输入预测变量的值。2.半监督学习监督学习需要使用标记数据,如果其他人没有从事过类似项目,则很难找到或生成这些数据。在半监督方法中,我们将一些标记数据与未标记数据一起使用。如您所见,数据没有完全标记,这就是它被称为半监督学习的原因。通过将标记数据与未标记数据相结合,可以提高模型的准确性。3.无监督学习无监督学习应用于未标记的数据。机器必须在没有任何监督的情况下找到数据中的模式、异同、执行聚类和降维。聚类:根据某些标准和相似性将数据分组到一个或多个集群中。例如,根据客户的购买行为对他们进行分组。降维:数据的某些特征或维度可能无法用于模型训练。使用某些算法,我们可以避免考虑维度和不相关的特征。这个过程称为降维。4.强化学习强化学习根据环境反馈优化代理。智能体在做出正确决定时奖励机器,并在做出错误决定时惩罚它。这种学习不需要我们事先收集数据然后清洗。该系统是自我维持的,试图在现实世界中自我完善。AlphaGO是一种基于强化学习的计算机程序,它击败了世界上最好的围棋选手。尾注来源:Pexels机器学习问题可以通过多种方式解决,您可以根据多种因素选择算法,例如准确性、客观性、数据大小和数据性质。您还可以参考备忘单并快速开始构建模型。解决问题并获得结果后,您可以进一步探索不同的算法,以找到最适合该特定问题的算法。