当前位置: 首页 > 科技观察

带着问题学习MachineLearning:什么是机器学习

时间:2023-03-16 12:30:05 科技观察

机器学习是一个不能接受的东西。如果有案例,那就走吧~Q:什么是机器学习?机器学习是一种使计算机能够像人类一样学习的技术。是一种从数据中发现有用知识的数据挖掘技术。例如?利用机器学习技术,类似今日头条给我推送喜欢看又看不完的短视频,(让我卸载了。。。)。比如淘宝知道你喜欢什么款式的衣服,总是在猜测你喜欢什么地方。问:机器学习有不同类型的数据吗?是的,非常不同。根据学习到的数据类型,可以分为监督学习、非监督学习和强化学习。问:什么是监督学习?监督学习是计算机学习带有结果标签的数据后,可以预测数据结果的学习过程。比如预测数值数据的回归,预测标称数据的分类等等。太抽象了。。。比如图像处理,垃圾邮件分类拦截等。Q:什么是无监督学习?无监督学习是计算机从没有结果标记的数据中学习后,获得有用数据的学习过程。自然还有一种半监督学习,介于两者之间。比如预测良恶性肿瘤,视频分析等。Q:什么是强化学习?强化学习类似于无监督学习。对没有结果标记的数据进行学习后,可以像监督学习一样预测数据结果。这种“四象”被认为是人类主要的学习模式之一。自然也很复杂,涉及到很多算法。下面说说常见的算法。Q:监督学习和非监督学习的典型问题是什么?机器学习中有很多典型问题,如回归、分类、异常检测、聚类和降维等。自然而然的,每一个问题都被推广到一个算法上,于是就有了对应的算法。问:什么是回归问题?回归,大家对线性回归都有印象。回归是一种数学模型,是统计学中使用的一种方法。是对一组因变量Yn和另一组自变量Xn之间关系的统计分析。比如我记得以前用SPSS的时候,回归统计的体表面积是跟身高体重相关的。从案例中可以看出回归多用于监督学习。问:什么是分类问题?分类包括监督分类和非监督分类。监督分类是大家一直都知道的。术语表示是指识别指定模式的监督识别问题。这类分类问题也可以像回归问题一样看作函数逼近问题。是的,用已知样本数据训练后,只能对未知样本进行分类估计,不能近似分类。无监督分类,没有任何先验条件,仅基于数据,(盲)分类。分类结果肯定是不同纬度的分类,但是无法确定分类的类别属性。问:什么是异常检测问题?异常检测,简单的说就是从一堆数据中区分异常值和正常值。术语表达,从数据集中的其他项目中识别项目、事件等。例如,文本错误。问:什么是聚类问题?聚类类似于分类问题。但它是一种无监督学习。就是把相似的样本分成不同的组或者更多的子集。关键词:相似,所以同一组(子集)的样本具有相似的性质,不同组(子集)的样本具有不同的性质。在聚类问题中,如何计算样本之间的相似度非常重要。Q:降维的问题是什么?降维,它的目的很直接,提取关键信息。术语表达式是减少样本数量并获得一组变量的过程。自然地,根据样本类型的不同,(我们上面介绍了监督学习和无监督学习,大家可以复习一下)降维问题也分为有监督降维和无监督降维。降维有两种方法:特征选择和特征提取。特征选择是在假设样本数据中包含大量冗余和无关数据的情况下,寻找主要数据的一种方法。特征提取是一种从高维数据中提取关键信息,将其转化为低维数据进而求解的方法。该过程伴随着删除数据和创建新数据。广泛应用于图像识别领域。