当前位置: 首页 > 科技观察

资本布局的人工智能,其实是人工智障?3分钟看懂什么是机器学习

时间:2023-03-19 00:46:01 科技观察

本文全长2300字,建议阅读3分钟好奇宝宝想知道人工智能机器学习是怎么学的?本文通过漫画让你了解人工智能的内部工作原理。近日,富士康宣布旗下工厂不再需要晚上开灯——因为不需要工人,所有工作都由人工智能机器完成。几乎所有的大佬们都在谈论人工智能。世界似乎不再需要人类了。人工智能你可能听过一百遍,但人工智能到底是什么?人工智能所谓的机器学习是如何学习的呢?它和你之前玩过的小霸王游戏机有什么区别呢?今天,我们用漫画让大家了解人工智能的内部工作原理▼我们举的例子是机器学习中的监督学习。人工智能机器学习分为有监督学习、无监督学习、强化学习和蒙特卡洛树等,这句话看不懂可以忽略,不影响后面的讲解。我是传说中的大boss,人工智能!害怕!其实人工智能基本上等于人工智障!人类一眼就能看懂的事情需要很长时间,而且不一定能处理。首先,我们来谈谈人工智能与传统计算机原理的关系。最传统的计算机就是这个东西——它的工作原理就是有一定的输入,就会有一定的输出。对于机器来说,原理是一样的。比如人类,在受到刺激之后,其实就是这样的。在现实世界中,当我们看到女朋友的脸时,无论她化什么样的妆,你都能一眼认出。然而,传统计算机单一的输入值和单一的确定输出的模式让人哭笑不得。但是如何让机器模仿人类的输入输出能力,拥有类人的智能。这就是AI问题的核心。其实需要做的是对复杂的输入信号进行分解计算,在计算中对不同的因素进行不同的处理,这样无论输入如何变化,都能得到一个大致合理的输出。用专业的话说,就是对输入输出之间的隐藏层进行一系列的权重调整,从而建立一个模型。这样一来,不管人脸加上什么伪装,只要落在一定范围内,机器就可以识别出人脸。这时候机器就可以像人一样认人了,就变成了人工智能。▼看到这里,你其实比90%的人都懂人工智能。但是人工智能具体是如何调整权重的呢?我们可以讲一个机器人靠脸杀人的故事。第一步是让机器识别人脸。所以我们要给它喂很多包含人脸的图片:把人脸的不同部位抽象成一组数字,比如鼻子可以极度简化成长宽两个数据,然后送给程序加工-人工神经现在网络这么火,就用吧。这些数字的流动确实有点像人脑神经的工作方式:这张图看似不可理解,其实很简单。就是把输入的数一个一个乘以那些系数,最后相加。是的,这些系数被称为“权重”。输出层输出一个普通数。我们给他设定一个门槛,比如20;计算牙齿、鼻子和眼睛,等于28,如果大于20,则判定输入为人脸。这几乎是一种非常原始的人工神经网络,称为感知器。但是,现在的神经网络会引入一种叫做激活函数的东西,把这种千篇一律的智障变成稍微聪明一点的样子:这个形象是什么意思?就是把一个简单的“是不是”问题转化为“百分之多少”的概率问题。它看起来更聪明吗?同时,聪明的你一定发现了,决定效果好坏的关键其实就是那些“权重”。如何获得正确的权重组合?这就是机器学习的意义:让机器根据每次测试的结果修正自己的权重。等一下,它怎么知道对错的?人类还需要提前对这些照片进行分类:哪些是人,哪些是狗,哪些是外星人……就像人类在给他一个标准答案的测试,所以叫“监督学习”。那么只要不断重复这个过程,权重就会逐渐调整到更合适的组合,输出会越来越好,判断也会越来越准确。以这种方式重复相同的过程以实现改进称为“迭代”。只要我们的神经网络设计得当,最终,人类是可以被准确识别的。现在最先进的算法在各种情况下都能达到98%以上的正确率!这整个过程称为“训练”。我们用来训练它的图片和每张图片对应的标签就叫做“训练集”。▼人工智能篇介绍就不展开了。如果继续往下读,你对人工智能的理解将远远达不到人类的99.99%。那么,你准备好成为一名石匠了吗?首先大家最好奇的应该是:程序是怎么调整权重的?这个叫做“反向传播”的过程是这样的:在每次训练中,我们都要判断程序给出的结论到底错了多少。我们已经说过,程序的猜测和答案是可以转化为数值的。将所有误差的平方相加,然后平均得到一个“损失函数”。当然,损失函数越小越好,这意味着我们的神经网络更强大。我们可能一开始就在山顶,也就是说“损失”特别大,所以要尽快下山止损。怎么做?最常用也是最有效的方法之一就是总是选择最陡峭的路线,这样你就可以轻松到达某个山谷。当损失函数达到某个最小值并且变化不大时,说明训练差不多完成了。这种方法称为“梯度下降”。具体来说,其实是在求导:看到这个公式是不是有一种想崩溃的感觉?如果还没有完全崩溃,我稍微解释一下:这个公式的意思就是把某个权重减那么多,损失函数对对应权重的偏导数乘以α。至于怎么求这个偏导数的值……你确定你真的想知道吗?而这个α也很重要,叫做“学习率”。意思是:发现错误后,改得太多或太少都不好。比如学开车,转弯的变化(系数)有多大,就看悟性了。▼好了,说完这么难的事情,我们再来八卦一下。为什么要让人工智能杀死那么多猩猩、海豚和蜥蜴?因为如果没有负样本,人工智能抓起来是对的。这样就没有学习和积累经验(调整权重)的过程,也没有能力在现实世界中真正找到人脸。不要被所谓的人工智能专家的术语所迷惑。其实人工神经网络的监督学习的整个过程无非就是做自动化的回归分析。从最简单的线性回归到多元非线性回归,是一个看起来越来越智能的过程。人工智能专家也是一步步掌握机器学习的。▼***,如果你能坚持到这一点……恭喜你,你已经成为半个机器学习专家了!如果喜欢,我们下次再聊其他人工智能技术,比如无监督学习和强化学习!参考资料:斯坦福大学公开课:《机器学习》FaceNet:AUnifiedEmbeddingforFaceRecognitionandClustering,FlorianSchroff,DmitryKalenichenko,JamesPhilbin,GoogleInc.EfficientBackProp,YannLeCun,LeoBottou《人工智能时代》,Jerry·Kaplan《心灵、语言和社会》,JohnSearle