当前位置: 首页 > 科技观察

机器究竟是如何学习的?人工智能的“左右斗技”详解

时间:2023-03-23 01:53:59 科技观察

金庸武侠小说《射雕英雄传》,有这样一个经典场景:“老顽童”周伯通被困时创造的“左右斗技”在桃花岛上,就是用左手和右手打架,在两只手的相互较量中提高自己的技艺。今天,这样的桥段竟然在人工智能领域上演。这是深度学习。“左右格斗”类似于深度学习中对抗训练的一个原理,即有两个角色——生成器和判别器。生成器类似于左手,充当攻击者;鉴别器类似于右手,充当防御者。判别器的目的是正确区分真实数据和生成数据,从而最大化判别准确率;生成器是尽可能逼近真实数据的潜在分布。两人需要不断提升辨别能力和生成能力才能获胜,从而达到目标最优化。今天,就让我们打开这个“神秘盒子”。深度学习的概念最早由JeffreyHinton于2006年提出。这是一种学习和利用“深度”人工神经网络的机器学习技术。深度学习作为人工智能领域最热门的研究方向,迅速引起了学术界和工业界的关注。目前,深度学习已得到广泛应用。例如,在博弈领域,AlphaGo通过深度学习以4:1的比分战胜了韩国围棋选手李世石,成为第一个战胜人类职业围棋选手的计算机程序;在医学图像识别方面,以深度学习为核心技术的X射线技术、NMR、CT、超声等医学图像多模态大数据分析技术,可以提取隐藏在二维或三维医学图像中的疾病特征;在图像处理中,最成功的领域是计算机视觉,例如图像风格迁移、图像修复、图像着色、人脸图像编辑和视频生成等。一种特殊的机器学习方法今天的人工智能实际上将现实生活中的问题量化为可计算的问题,然后使用计算机来计算它们。数学模型弥合了中间。在现实生活中,很多问题都可以通过建模来解决。比如计算远程火炮的弹道问题,计算日食月食的时间地点等等,我们只需要用计算机语言写出相应的公式,然后代入参数就可以计算出来了。然而,更多问题的解决方案是不确定的。即使找到了相应的数学模型,也不知道应该代入哪些参数。比如语音识别、人脸识别和机器翻译。因此,我们需要让计算机通过自主学习,从大量的数据中获取相应的参数。这个过程称为机器学习。机器学习旨在发现数据存在和利用的模式,并使用它们来学习和做出预测。机器学习的过程就是用计算机算法不断优化模型,使其越来越接近真实情况的过程。这与人类的学习完全一样。通常检验学习的手段是通过考试,如果分数不及格,则需要进一步学习。机器学习也应该以这种方式衡量。它的目标是使用技术术语来“最大化期望值”。机器学习的效果取决于两个方面:一是学习的深度。机器学习不能“一口吃掉一个胖子”,其训练算法需要迭代执行。这就好比人在学习的时候,要通过复习来“温故知新”。机器学习迭代次数越多,即学习越深,得到的数学模型越好。另一个方面是数据的质量和数量。当我们做大量高质量的练习时,成绩就会提高。机器学习也是如此。训练数据量越大,学习效果越好。根据数学模型的特点,机器学习有两种方法:一种是利用已知模型进行训练;另一种是在模型未知的情况下,设计一些简单通用的模型结构,然后用大量的数据进行训练,Bewhatyouaretrainedtobe。这就是我们经常听到的关于人工智能的“黑匣子”问题。即使修炼有效,也不清楚里面是什么。深度学习是机器学习的后一种方法。人工智能涵盖的领域非常广泛,深度学习只是其中的一个分支,属于机器学习的范畴。人工智能需要“独立思考”的能力,需要机器学习技术的支持。深度学习是帮助机器实现“独立思考”的一种方式。深度学习迎来革命性突破人工神经网络,简称神经网络,是一种模仿动物中枢神经系统结构和功能的数学模型。它是由大量广泛连接的简单处理单元组成的人工网络。它实际上是一种用于估计函数等的特殊分类器。神经网络为许多问题的研究提供了新的思路,尤其是快速发展的深度学习,可以发现高维数据中的复杂结构,取得比传统机器学习更好的结果。1950年代,人类首次设计出计算机可以运行的神经网络算法。此时的神经网络虽然给了人们很大的想象空间,但解决不了实际问题,因此被打入了“冷宫”。到20世纪80年代后期,反向传播算法被提出,它允许神经网络模型从大量样本中学习统计规律,从而对未知事件做出预测。随后,相继提出了支持向量机等各种机器学习方法。但是,这些模型的结构都是浅层学习方法,处理复杂问题的能力受到一定的制约。因此,神经网络进入了“冷宫”。2006年,加拿大教授Hinton和他的学生提出了一种深度学习神经网络的“快速学习”算法,迎来了深度学习的革命性突破。深度学习展示了通过学习深度非线性网络结构从少数样本集中学习数据和基本特征的强大能力。从那时起,神经网络学会了以惊人的准确度迭代分类和识别物体。计算能力已经成为推动深度学习的有力工具。人工神经网络提出以来的50年里,一直未能很好地解决智能问题。究其原因,除了算法本身的不完善外,就是计算机的绝对速度不够快,单位计算能力的能耗过高,无法通过大量的服务器构建并行计算系统,实现深度人工神经网络。那么,突破口是什么?答案是摩尔定律。摩尔定律是英特尔联合创始人戈登摩尔于1965年观察到的,即计算机的整体处理能力大约每2年翻一番。经过近50年的历史检验,摩尔定律显示出惊人的准确性。摩尔定律的结果是,在过去的半个世纪里,计算机处理器的性能提高了数亿倍,而功耗却降到了百分之一。从能量的角度来看,摩尔定律反映了人类在单位能量消耗下所能完成的信息处理能力的大幅提升。而这就是实现人工智能的基础。从某种意义上说,不仅仅是深度学习技术,今天的人工智能也是靠计算能力来实现的。人工智能的兴起具有三个技术要素:一是解决可计算问题,即算法上的突破;二是积累了大量数据,形成可学习的原材料;第三,根据摩尔定律推测,处理能力不断提升。算力是推进深度学习的利器。计算能力越强,同一时间积累的经验越多,迭代速度越快,深度学习的性能就越高。不断进化的深度学习之路1997年,“深蓝”在国际象棋比赛中击败了加里·卡斯帕罗夫;2016年,AlphaGo在围棋比赛中战胜了李世石。虽然两个人工智能系统都学会了下国际象棋,但它们的教学方式和下棋方式却大不相同。DeepBlue的核心评估函数对给定的棋盘进行数值“排序”,并且该函数是手工制作的。这种打法其实是一种“蛮力”。《深蓝》将其评估功能应用于许多可供选择的未来状态,为每个玩家提前搜索七八步,以每秒2亿次的速度评估情况。AlphaGo的学习方法很不一样。它通过双管齐下的深度学习方法“学习”,使用“价值网络”评估位置并使用“策略网络”选择动作。深度学习神经网络的训练一部分是通过监督学习使用人类高手对局数据集(棋步总数约3000万步)进行,另一部分是通过自对弈的无监督强化学习进行游戏(模拟数以万计的随机游戏)。比赛)。它不使用预测搜索,移动是对单个“Goposition”进行整体评估的结果。2017年5月,在中国乌镇围棋峰会上,AlphaGo的升级版AlphaGoZero对战世界围棋第一冠军柯洁,总比分3:0获胜。令人震惊的是,AlphaGoZero一开始并没有接触到人类的国际象棋记录。它采用强化学习的新方法,从单个神经网络开始,通过神经网络强大的搜索算法,进行自我对弈训练。随着自对局次数的增多,神经网络逐渐调整,提高对下一步的预测能力,最终成为棋力超强的“棋手”。更重要的是,随着训练的深入,AlphaGoZero还自主发现了游戏规则,想出了新的策略,为围棋这一古老的游戏带来了新的感悟。目前,深度学习已在多个领域取得技术突破并展现出优异的成果。但它仍然存在一些局限性:缺乏理论研究、无监督学习能力弱、缺乏逻辑推理和记忆能力等。深度学习对未来社会发展具有重要意义,需要不断深入研究从多个方向和角度更全面地挖掘深度学习的潜在价值。面对复杂的战场,以深度学习为代表的人工智能技术逐渐渗透到军事领域,深刻影响着人类战争。可以推断,未来深度学习作为“左右格斗术”,将不断升级进化,开启更高境界。