人工智能技术进步的速度越来越快,各个细分技术创造的价值也越来越多地得到展现。2013年,DeepMind发明了DQN算法,成功地将深度学习和强化学习结合起来,开启了深度强化学习的新时代。随后的几年里,强化学习的成果日新月异,很多非常难的问题都被深度强化学习算法解决了。2016年,谷歌AlphaGo以4:1击败围棋世界冠军、职业九段围棋选手李世石,不仅让深度学习为人们所熟知,更掀起了人工智能的“大众热潮”,大家付出了更多关注强化学习领域。技术要点。使用强化学习的一个很好的例子是教机器人如何走路。机器人先向前迈出一大步,然后倒下。这一大步和跌倒是强化学习系统关注的响应点。由于反馈是负的,继续调整,系统会根据多次负反馈的比较,最终确定机器人应该走小一点的步子,一直走小一点的步子,直到机器人走路不摔倒为止。通过强化学习,波士顿动力公司的机器人已经掌握了举重、后空翻和跳上平台的要领。DisneyImagineering通过让类人机器人执行致命特技,将其提升到一个新的水平。有业内人士指出,强化学习与其他人工智能技术有很大区别,即其学习范式与其他技术不同。它不需要我们收集数据,也不需要我们做任何标签,但我们称它为代理(Agent),把它放在一个环境中,就像动物或者我们生活的环境一样,它会处理自己与环境打交道,学习如何在环境中完成任务和解决问题。强化学习主要由Agent、Environment、State、Action、Reward组成。agent会在环境的当前状态下根据奖励信号进行动作,从而达到环境中的不同状态,并获得奖励。除了强化学习,机器学习也备受关注。机器学习是人工智能的一个子集,是通过在不同场景中的经验来训练系统的能力。随着车辆变得更加自主,开发人员可以使用机器学习来训练系统识别物体并用更少的数据更好地解释其环境。让我们再看看深度学习。深度学习是通过算法从有限的样本中总结出一般规律,可以应用于新的未知数据。例如,我们可以从一些历史案例中总结症状和疾病之间的规律性。这样,当有新的病人到来时,我们就可以根据总结出来的规则来判断这个病人得的是什么病。那么,强化学习、机器学习和深度学习有什么区别呢?简单来说,人工智能的范围最大,涵盖机器学习、深度学习、强化学习。如果把人工智能比作孩子的大脑,那么机器学习就是孩子掌握认知能力的过程,而深度学习就是这个过程中非常高效的教学系统。由强化学习、机器学习等技术组成的人工智能具有广阔的发展前景。从全国来看,据艾瑞咨询预计,2022年国内人工智能核心产业规模有望达到1573亿元,复合增长率达58%,产业将继续保持快速增长。如此广阔的市场空间,吸引了各界投资者的目光。值得一提的是,发展“以人为本”的人工智能是全社会的课题,需要政府、工商界、学术界和所有利益相关方共同承担责任,共同推进。企业作为技术应用和推广的主体,肩负着不可推卸的社会责任。企业在研究强化学习相关技术时,要自觉遵守法律法规和社会公约,促进其有序、可持续的应用。未来,世界的可持续发展将越来越依赖于数据创造的价值,而人工智能是数字经济广泛应用的技术之一。或许再过几年,人工智能将在精准农业、智能家居、远程医疗、自动驾驶等领域发挥更重要的作用。
