当前位置: 首页 > 科技观察

看完这篇文章,我再也不敢冒充人工智能人了

时间:2023-03-19 19:35:24 科技观察

什么是机器学习?给你十秒钟,请给出答案。……不知道?所以你还想从事人工智能行业?快点!听好了:机器学习使用数据中的模式来标记事物。听起来很棒?……好了,到此为止吧。机器学习的核心概念其实很简单,简单到让人“懵逼”。我所说的“尴尬”是指,如果有人在你面前“假装”并让你认为机器学习很了不起,那么他们应该感到尴尬。为什么?并查看此“反伪装”指南。本指南的作者是CassieKozyrkov,她是Google的首席决策智能工程师,不仅美丽而且善良。经常在HackerNoon上发布一些人工智能相关的干货。在本指南中,她以葡萄酒为例。她还亲切地提到,如果你不喜欢喝酒,你可以把酒调成任何你喜欢的饮料,比如茶。好了,废话不多说,我们掀起小板凳进入正题~机器学习是如何工作的呢?机器学习不是魔法,没有数据就不可能学习,所以要完成这个类比,你得喝点酒。数据需要奉献才能学习。你可以体验一次喝完50种酒是什么感觉。重点是酒还没喝完,我还要处理信息,可视化,以便在下面查看。每种酒都有对应的年份。品尝后,一定要打分,然后给出判断。这个判断就是我们希望未来人工智能可以自己做出的判断:Y表示好吃,N表示不好吃。相关数据记录在电子表格中(左),但为了查看方便,我将所有数据可视化(右)。AlgorithmNext,是时候进行下一件事了。你能把红色区域和蓝色区域分开吗?机器学习就是选择一种算法来完成这个过程,选择哪种算法决定了最终会得到哪种模型。如果您想画一条线来完成工作,恭喜!你刚刚发明了一种机器学习算法,叫做……感知器。是的,它好高大上,它的名字也好酷。请不要被机器学习中的“行话”吓倒,这通常是一个大骗局。但是你画的线应该指向哪里呢?我们的目标是将Y与N分开,画一条直线并不是一个非常聪明的解决方案。选择机器学习算法的目的是找到最合理的分界线。这需要通过优化目标函数来完成。你可以这样想优化:目标函数就像棋盘游戏的规则,优化就是想办法获得高分。传统上,在机器学习中,我们更喜欢“大棒”而不是“胡萝卜”。即,对错误进行评分。这就是为什么机器学习中的目标函数被称为“损失函数”,目的是使损失最小化。想自己玩吗?回到上面的图片,用你的手指在屏幕上画一条线将Y和N分开,直到零未命中。Perceptron同志,你觉得未来触手可及吗?也许,你得到的解决方案是这样的:最左边的这种结果,我没试过。中间那个也不太合适。我最喜欢的是最右边的那个。算法多种多样,它们之间最不同的方面之一是它们如何确定分界线。痴迷于优化的一群人会告诉你,以微小的增量调整分界线是不明智的,而且有更好、更快的方法来找到最佳点。一些研究人员毕生致力于找出一种最简单地找到最佳截止位置的方法,无论数据多么复杂。该算法的另一个不同方面是边缘的形状。边界线不一定是直的。不同的算法使用不同的边界线形状。如下图所示:为追赶潮流的人设计的算法今天,追赶数据科学浪潮的人不会选择用直线来区分。那些看起来有弹性、有曲线的线条很受他们欢迎。他们使用实际上没有很多神经元的神经网络算法。我更倾向于称它们为“瑜伽网络”或“多层数学运算”,但似乎没有人喜欢我这样称呼它们。不同的算法会告诉您它们在数据中放置的边界线的形状。但如果你是一个应用型机器学习爱好者,即使你记不住他们的圣经名字也没关系——在实践中,你只需要将尽可能多的数据输入算法,然后重复执行那些观察。看起来有希望的事情会做。模型一旦绘制了边界线,算法就完成了,你可以从中得到你想要的东西:一个模型。下次我给它看一瓶新酒时,它可以将数据转化为决策。标签一旦你让你的新模型开始工作,你就可以将葡萄酒的年份和等级输入计算机,你的模型将找出相应的区域并输出标签。所以问题是,我们怎么知道它是否有效?有谁知道这是不是噱头?最直接的方法是检查输出。通过在一堆新数据上运行模型来测试您的模型,并确保它继续表现良好。事实上,无论模型是由算法还是由程序员构思出来的,都会这样做。结论在我之前的另一篇文章中,我将整个过程做了一个类比:诗人和机器学习写在纸上。这种方法决定了诗歌的形式(界线形状)是俳句还是十四行诗?一旦他们以最好的方式完成十四行诗,它现在就是一首诗(模型)。机器学习模型与传统编程有很大不同。但是这样得到的模型和程序员通过观察问题,手动制定一些规则而写出的代码并没有太大区别。两者在概念上是相同的。不要到处说机器学习的“再训练”有多厉害。程序员也可以坐在那里调整代码以响应新信息。仅此而已吗?是的,几乎。机器学习工程最难的部分是安装软件包,然后处理数据集,然后在其上运行有限的算法。接下来是“超参数调优”,别上当了,就是在生成模型之前没完没了地摆弄代码设置。当你在新数据上评估模型时,如果结果不理想,你必须一遍又一遍地重复,直到你能做到为止。这就是为什么雇用对失败有耐心的人如此重要的原因。如果是玻璃心,估计打几个回合就会吐血。如果你期待奇迹,我劝你尽快失望。机器学习是一个非常无聊的过程。但是,如果你能屏住呼吸,你能做的事真是太神奇了。它可以帮你写出你自己想不到的代码,也可以让你把那些想不出来的代码自动化。最后提醒一下。不要因为它的简单而讨厌它。要知道,杠杆也很简单,却可以撬动整个地球。