当前位置: 首页 > 科技观察

如何用初中知识看懂机器学习是干什么的

时间:2023-03-19 14:54:24 科技观察

前言百度百科搜索“机器学习”,映入我眼帘的是一个我达不到的高度:机器学习是一个多领域的交叉学科学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度论等诸多学科。专门研究计算机如何模拟或实现人类的学习行为以获得新的知识或技能,并重组现有的知识结构以不断提高其性能。在怀疑自己智商的同时,我也在想:这段话除了说明机器学习很牛逼,可以模拟人类的学习行为之外,似乎并没有让我明白这四个字的意思,反而加重了我的思维负担,脑袋越来越重,我继续往下看,找到了这个词条在我看来最重要的定义:然而,它不是蛋!!!就像看笑傲江湖里面的《葵花宝典》一样,因为没有自功,剑法招式再高深也只是片面的,除了牛逼,还是牛逼。至此,我终于明白了,原来是打开方式不对,而且一开始就错了(需要出宫)!因此,我们需要改变方法。这次我们用初中数学开篇:从一阶函数开始在初中数学中,我们经常会遇到这样一道题:给定平面内的三个点坐标(x,y):A(1,3),B(2,5),C(3,7)求x=5时y的值。面对这样的问题,我们可以先把三个点放在坐标轴上看,如图:可以发现三个点在一条直线上,符合线性函数的性质,那么我们只需要求出这条直线的方程,将x=5代入方程即可求出此时y的值。至此,问题就变成了:已知三个点A(1,3)、B(2,5)、C(3,7),当x=5时,横坐标与纵坐标的关系符合线性函数,y的值。至此,题目已经进入了我初中知识水平的水平。只需将A、B、C三点代入y=kx+b,即可得到关于k、b的方程组。可以得到解:那么当x=5时,y等于2*5+1=11(我来算,我算这个)。问题的思考机器学习无非就是和上面类似的一个过程。给定一定数量的输入(x)和输出(y)数据,找到一个函数来表示这些x和y之间的关系。根据这个函数,我们可以很容易的在已知x的情况下求出y。比如我们在网购后输入评论,系统可以自动识别是好评还是差评。我们可以将上述案例的这个函数称为模型,x称为特征,y是机器学习要预测的结果,已知x和y的组合称为训练数据。训练的过程就是找出x和y的值和y的关系的过程(而不是用鞭子抽打的过程)。然而,真正的机器学习案例往往没有这么简单。一个只有一个特性x的功能如何满足更复杂的业务需求?只要你给我钱,对不起,太远了!”当特征个数为多个时,我们仍然可以在上述线性函数基础上进行模型假设,问题就可以解决。这是机器学习中更基本的线性回归。如果你觉得这些功能只能找到一个值,没有意义,你能帮我在评论区识别哪些是好评哪些是差评吗?”当然没问题!只要将y的结果映射到0和1之间,然后判断y,y>=0.5表示好评,y<0.5表示差评,然后这个映射函数就叫做激活函数,不管它是如何实现的,理解是主要的”像这样它实现了机器学习中分类任务的逻辑回归。如果你觉得一个特征对应的权重有点低,很多东西不是线性相关的,怎么解决这个问题呢?“一层重量不够再加,不够再加!”是不是要加上上面的过程是不是有点远了,一不小心就到了深度学习的境界,路漫漫其修远兮智商跟不上……(所以用省略号代替)以上的总结case只是机器学习中监督学习的过程。真正的机器学习往往比这复杂得多。也分为无监督学习和半监督学习。在此不再赘述。有机会我会再写的。再见!