当前位置: 首页 > 科技观察

人工智能、机器学习与深度学习

时间:2023-03-13 22:29:56 科技观察

1人工智能与机器学习Learning、DeepLearning关系图现在我们有一个问题——“你心目中的人工智能是什么?”,我们就把无聊的文字往下看它会变得有趣。人工智能之父——“艾伦·马西森·图灵”提出了一种判断机器是否智能的测试方法,即图灵测试。这个原则说:如果一个人用任何一系列问题来审问他看不到的两个对象:一个是正常思维的人;另一个是机器,如果经过多次审问,他不能得出实质性的区别,那么他就可以相信,机器行业也拥有人类的“智能”。人工智能最早的应用——二战期间,图灵协助英国军方破译了著名的德国密码系统Enigma,为扭转二战盟军大西洋战场立下汗马功劳。英国战争情报中心破译的消息数量从每月39,000条增加到84,000条,使第二次世界大战至少提前了几年结束。感兴趣的朋友可以看看相关电影《模仿游戏》。此处不再赘述。机器学习:机器学习是一门多领域的交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂性理论等学科。专门研究计算机如何模拟或实现人类的学习行为以获得新的知识或技能,并重组现有的知识结构以不断提高其性能。它是人工智能的核心,是计算机实现智能化的根本途径。机器学习本质上借鉴了我们人类的学习方法。例如,人的智力大部分是通过后天训练和学习获得的,并不是天生就具备的。新生儿出生时没有认知能力,长大后也是如此。在学习的过程中不断获取信息,从而刺激大脑,建立认知能力。建立孩子对“苹果”、“橘子”的抽象概念,需要不断地带他认识很多“苹果”、“橘子”的例子和图片,建立他对“苹果”、“橘子”的认知。图1.2知识卡机器学习中经典算法的发展历程图1.3机器学习经典算法这里,我们只用号称机器学习天花板的经典SVM算法来说明机器学习的实现原理!还是一样,我们结合实际问题来理解SVM,这样会更清晰。例如,如果给你一堆“猫”和“狗”的图片,让你分别识别“猫”和“狗”,你会怎么做?图1.4猫和狗的图片像这些图片,我们很容易将它们分类,因为我们很早就建立了“猫”和“狗”的认知,但是我们中没有多少人愿意做这种枯燥的工作,我们有机器,为什么不训练机器来帮助我们完成这项简单而无趣的工作呢?2数字图像和模拟图像在揭开机器学习和深度学习的神秘面纱之前,先介绍一下图像处理中最重要的项目——“图像”。图像现在可以大致分为“模拟图像”和“数字图像”。模拟图像:也称为连续图像,指的是在二维坐标系中连续变化的图像,即图像的像点无限密集且具有灰度值(即变化值图像从暗到亮)。连续图像的典型代表是通过光学镜头系统获得的图像,例如人的照片和场景的照片,有时也称为模拟图像。胶片拍摄的照片为模拟图像,一寸、二寸照片根据胶片冲洗,不影响视觉效果。然而,模拟图像包含的信息量巨大,我们通常需要用计算机来处理图像,因此数字图像需要由有限的行和有限的列组成。如图2.1所示:图2.5猫狗分类点集其中,我们可以认为红色的点是“猫”,蓝色的点是“狗”。通过以上特征我们可以很明显的看出红点和蓝点之间是有差距的!而我们让机器找一条线把红点和蓝点分开,这样机器就可以帮我们识别图片是猫还是狗!(具体算法就不过多介绍了,有兴趣的可以百度SVM)分类效果如下图所示:图2.6SVM二分类线我们可以看到图中有一条实线,新的图片被计算出来,结果在实线上方我们认为是蓝色的点是“狗”,反之,红色的点是“猫”。这是一个简单的二分类,依此类推,我们可以实现多分类!如图:图2.7SVM三分类线从“猫”和“狗”的分类,我们基本可以得出机器学习解决问题的过程:3深度学习就像机器学习,是一个分支深度学习是在人工智能的基础上发展起来的,是在机器学习的基础上发展起来的一个分支。图3.1深度学习的比例图。深度学习也称为人工神经网络。它是基于我们自身认知水平的产物。以下图中的生物学研究成果为例。我们通过眼睛收集信息,通过神经网络传递给大脑,最终得到我们观察到的结果。图3.2人体神经网络结构图深度学习就是这样,下面举个简单的例子来分析一波深度学习的工作方式。现在给我们的题目是简单的手写数字0-9这10个数字的识别。让我们正确识别这10个数字。这个过程其实比较简单:我们先收集手写的数码图片,然后给对应的数码图片贴上相应的标签。把图片和标签都告诉计算机,让它在构建好的卷积网络中训练学习。学习模型的验证非常有用。图3.3图像标注训练图为什么说深度学习是人工神经网络。接下来我们可以看看这张图。图3.4手写数字神经网络图输入层输入层可以看成是一张输入图像,空心圆圈暂且理解为像素点。这些像素经过中间的隐藏层处理(可以看作是神经元的传递),最后输出到输出层,一共有10个数字。10个数计算出来后,范围一般在0-1之间。从上到下可以看成0-9,这是一个数的概率值。例如:我们将一张数字9的图片放入训练好的模型中,当它到达输出层时,十个数字的数组为[0.12,0.32,0.33,0.10,0.01,0.01,0.01,0.01,0.15,0.99]分别表示计算机认为这张图片是0的概率是0.12...9的概率是0.99。然后我们的计算机会选择概率最大的0.99对应的label来认为这张图片是9。这些隐藏层的隐藏层就像我们的神经网络一样,起到了自动特征提取的作用,从而具有更高的准确率比传统的机器学习算法。那么深度学习就一定比传统机器学习好吗?事实上,它们都有各自的优点和缺点。深度学习的优势:1.准确率高(超越传统机器学习),适用性广。2.端到端,保密性强(隐藏层相当于一个小黑盒,直到最终输出结果你才知道自己在哪里)。3.无需手动提取特征。...深度学习的缺点:1.计算量大,硬件要求高(网络层数越多,计算量越大)。2.训练时间长,通用性不强(训练后能认出来,不训练可能认不出来)。3.不成熟(全世界的专家都在研究隐藏层,而我们人类其实可以在不知道具体原理的情况下创造东西,只知道这样可以实现功能)。...机器学习的优势:1.通用性强。2.硬件要求低。3、手术时间短。4.更成熟。...机器学习缺点:1.过度依赖二值化。……到了这里,想必大家对人工智能、机器学习、深度学习都有一定的了解。回到最初的问题“你心目中的人工智能是什么?”也许现在的技术和你想的略有不同。动物。但是未来一定会有像电影里那样的人工智能机器人(好吧,题外话)