当前位置: 首页 > 科技观察

Python深度学习:为什么要学习深度学习?

时间:2023-03-14 19:34:45 科技观察

2016年初,围棋传奇选手李世石与围棋界的“新手”展开了一系列较量。围棋是一种棋盘游戏,起源于2500年前的中国。它是比国际象棋更复杂的策略游戏,来自全球75个国家的玩家积极参与其中。九段围棋高手李世石,自2002年以来多次夺得世界冠军,他面对的是一个看不见的对手——AlphaGo。AlphaGo由谷歌在伦敦的DeepMind团队开发。不知道李世石在赛前对他的对手了解多少,也许他从科普作家马修布拉加关于围棋的文章中得到了安慰。这篇发表于2014年的文章在谈到围棋时说:“……是计算机智能尚未掌握的为数不多的游戏之一。该游戏有如此多的可能走法,以至于程序员长期以来一直处于僵局。”但在数据科学上,24个月是相当长的时间。谷歌的深度学习算法可以击败优秀的计算机对手,即使对手有四名玩家。2016年1月,AlphaGo以5:0的比分战胜了欧洲冠军范默。2016年3月,AlphaGo挑战传奇棋手李世石。1、最后一枚棋子落下之前,胜负已分明。法国著名媒体CAUSEUR尖叫:“李世石的耻辱日。”这位震惊的九段冠军艰难地用数学算法讲述自己的败北:“……我本应该表现得更好,本应该有更好的成绩,本该有更好的比赛过程。我很抱歉没有达到很多人的期望。有我无能为力。”李世石只是另一位在人机对战中备受推崇的选手。人机大战的历史可以追溯到约翰亨利与新技术蒸汽钻机之间的史诗般的战斗。在那场非限制赛中,双方打得势均力敌,亨利最终获胜,但不久后就崩溃身亡。随着铁路蜿蜒穿过美国,蒸汽钻机成为必不可少的工具。深度学习之于李世石,就像蒸汽钻之于约翰·亨利。1.2—一件奇怪的事情奇怪的是,对于那些以建立专家模型为生的人来说,神经网络和机器学习中其他高度先进的技术的好处是显而易见的。事实上(与理论推测相反),深度学习的惊人成果受到商界、政府机构、研究界以及越来越多的学术界的高度重视。正如一位学者所说:“20世纪90年代是经验主义复兴的激动人心的时刻。我们从未想过我们的努力会如此成功。”当时,我们想要的只是一个座位。我们所想的只是为不同于当时其他研究的工作腾出空间,在当时流行的各种研究之外。1.3两类人还记得那个老笑话吗?世界上有两种人——相信世界上有两种人的人和根本不相信前者的人。好吧,我确实相信世界上有两种类型的数据科学家。我说的不是那些学计算机的和学统计学的。任何称职的数据科学家都可以在需要时学习概率、统计、数据结构和算法。事实上,本书中的建议同样适用于这两个学科的数据科学家,我们将看到对这两个学科都大有裨益的例子。我也不是在谈论机器学习狂热者与传统统计建模。数据科学家。经典统计建模和现代机器学习开发的算法在识别和利用数据集的重要特征方面都发挥着重要作用。本书将帮助你更好地理解这两种方法,并将它们结合起来更有效地融入到分析数据集中。我什至不是在谈论具有专业领域知识的数据科学家和通才。深入研究并掌握一门学科是有回报的;灵活地跨越多个学科之间需要非凡的才能,同时也能收获颇丰。本书将在这两个方面为您提供帮助。嗯,我认为世界上的两种数据科学家是那些拥有深度学习技术知识和深度学习技术的人。没有深度学习的技术知识。我并不是说缺乏这方面知识的人不如当代同行专业。简而言之,深度学习知识使您可以使用更广泛的工具,并可以从不同的方法中学习解决具有挑战性的问题,并快速有效地得出解决方案。简而言之,深度学习扩展了您的数据科学工具包。一个对深度学习的优秀方法知之甚少的数据科学家,那么与具备这方面技能的同事相比,将是一个非常显着的劣势。从衰老研究到动物学分析,对深度学习技能的需求非常高。2、什么是深度学习深度学习是机器学习神经网络、人工智能、图形建模、最优化、模式识别和信号处理等技术融合产生的一个领域。在严谨的学术期刊上,这门新兴学科的模型得到了严肃知识分子的推崇:“深度学习网络是神经网络的革命性发展,甚至被认为可以用来创建更强大的预测模型。2.1蓝图成功简单来说,深度神经网络是一种用多层抽象来表示概念或特征的方式,事实上,任何工程师或架构师都在使用这种基本方法。想一想大型办公楼的蓝图:在最底层,电气、管道和排水系统的细节都已标出;而在最高层,可能会有一个旋转的观景台和旗杆勾勒出整个30层楼的轮廓。深度神经网络也遵循这个非常有用的方案。该程序几乎用于生活的每个领域。医生有医学证书,教师有教学大纲,公司有盈利计划书,甚至学术界也有发表研究论文的标准。Infact,it'shardtofindexamplesinlifethatdon'texpressideaswithlayersofabstraction—armycommandersdeploythesameprinciplestofight,politiciansusetowinelections.将相同的原则应用于神经网络或其他多层模型的分类和预测是没有意义的。更快的计算机处理器、越来越便宜的内存和新的数据格式使任何规模的公司都可以使用深度学习进行数据分析。2.2监督和非监督学习深度学习使用多层机器学习模型对数据进行监督或非监督学习。模型中的不同层由非线性数据变换的多个阶段组成,数据的特征依次表示在更高、更抽象的层上。数据科学领域有两种基本的学习类型,如下所示。监督学习:训练数据包含已知结果。该模型是根据这些结果进行训练的。无监督学习:训练数据不包含任何已知结果。算法自行发现数据中的联系。2.3深度学习的过程在学习深度学习的核心思想时,我们一般采用的方法一般如图2.1所示。无论发展出什么样的机器学习模型,最终都会回归到这个基础模型。输入数据被传递到模型,通过多个非线性层进行过滤,最后一层包含一个分类器——它决定了对象所属的类。图2.1通用深度学习框架数据学习的目标是预测响应变量或对具有给定属性集的响应变量进行分类。这有点类似于线性回归,其中一组自变量(也称为属性或特征)用于通过线性模型预测因(响应)变量。然而,传统的线性回归模型不被视为深度学习,因为它们没有对数据应用多层非线性变换。其他流行的数据学习技术是决策树、随机森林和支持向量机。这些技巧很强大,但并不深奥。决策树和随机森林对原始输入数据进行处理,无需转换或生成新特征;支持向量机较浅,因为它们仅包含核函数和线性变换。同样,单隐藏层神经网络不被视为深度神经网络,因为它们只包含一个隐藏层。3、深度学习能解决什么问题?深度学习的力量来自于通过适当数量的并行非线性步骤对非线性数据进行分类或预测的能力。在从原始输入数据到实际数据分类的过程中,深度学习模型学习输入数据的层次特征。每一层都从前一层的输出中提取特征。本书所指的深度学习模型是具有多个隐藏层的神经网络。如图2.2所示,最简单的深度神经网络至少包含两层隐藏神经元。每一层的输入都来自上一层的输出。图2.2具有两个隐藏层的前馈神经网络多层深度神经网络具有多个非线性级别,可以紧凑地表示高度非线性和/或高度变化的函数。它们擅长识别数据中的复杂模式,可用于改进计算机视觉和自然语言处理等方面,并可解决非结构化数据问题。全球发行和广泛阅读的杂志《IEEE Spectrum》报道:“数据科学家供不应求。这些专业人员享有高薪和大量股票期权……”据麦肯锡全球研究所称,仅美国就缺少140,000至190,000名合格的数据科学家哈佛商业评论称,数据科学是21世纪最具吸引力的工作。4.哪些领域用到了深度学习?深度学习技术正在医疗保健行业、医学图像处理、自然语言处理、提高广告点击率等领域进行商业应用。微软、IBM、雅虎、推特、百度、PayPal和Facebook都在使用深度学习来了解用户偏好,以便他们可以推荐有针对性的服务和产品。深度学习无处不在,甚至被用于智能手机以支持语音辅助技术。很难想象哪家企业不会从深度学习中获益。思考5分钟,然后列出您的最佳想法。以下是我想到的领域列表:流程建模和控制健康诊断投资组合管理军事目标识别MRI和X射线分析银行和其他金融机构的个人信用评级营销活动语音识别股票市场预测文本检索金融欺诈检测RichardSocher在其中发现了一个有用的应用,并与他人共同创立了MetaMind,这是一家专门从事医学图像分析和自动图像识别的公司。其他数据科学家、企业家、应用研究人员,甚至可能是您,都将追随Richard的脚步进入这个不断增长的利润空间。4.1深度学习能否揭开永葆青春的秘密?有一天,我收到了一份科研机构的新闻稿,里面有一个新奇的消息——发生了一件很有意思的事情,涉及到深度学习。本新闻报道涉及美容行业,这是一个每年价值超过2600亿美元的全球市场。美容产品的核心是保持青春——逆转衰老。在世界各地,这种承诺体现在人们每年每天花费数百万美元进行营销。带有年轻、成熟、快乐人物形象的广告充斥着人们的手机、平板电脑和笔记本电脑。每当你恰好在读这本书时,一款承诺永葆青春的美克新品刚刚上市。去看看,快速上网搜索一下...4.2老龄化的挑战老龄化的挑战一直是历史上伟大的思想家、政治家和科学家关注的焦点。美国老年学家I.L.纳舍尔在他的经典著作中写道:“为什么人会变老,或者为什么在身体机能完美一段时间后,器官和组织会退化,变得虚弱和患病,直到它们不再能够维持生命所必需的和谐相互关系是生命的一部分生死攸关的大问题。”直到1601年,英国女王伊丽莎白二世颁布的《济贫法》才缓和了这个问题,被遗弃的老人在无能力和贫困的困境中成为制定法律的关键问题:“……维护秩序和促进福利国家。”《济贫法》孩子们需要供养他们的父母和祖父母,因为I.L.Nascher观察到:“在中国,有敬祖敬老的精神,但这里没有。”《济贫法》在英国已经延续了250多年。在此期间,英国的预期寿命翻了一番,从40岁左右增加到80多岁。其他国家也有类似的趋势。4.3众多理论预期寿命稳步上升的原因有很多。临床外科专家维克多·霍斯利爵士将衰老归因于甲状腺退化;著名科学家ElieMetchnikoff提出“吞噬作用”理论——大肠的白细胞破坏加速衰老的细菌;著名的老年学家Shock博士大胆地说:“也许老年学研究最有用的贡献之一就是证明衰老不一定与退化和疾病有关,”自信地宣称。关于衰老的主题仍有许多理论,生物学家、老年病学家和人口学家之间存在巨大分歧。衰老是一种病吗?人的生命是有限的吗?衰老可以停止甚至逆转吗?4.4数据科学家的回答一条新消息引起了我的注意,因为它说深度学习可能很好地解决衰老问题。由YouthLab联合创始人AlexZhavoronkov领导的研究人员进行了一项研究,旨在确定一组与衰老相关的生物标志物,如果成功,可用于以有针对性的长期方式跟踪干预措施的有效性。性别。这项研究令人震惊的事情之一是它只需要进行基本的血液检查。研究人员开发了一套深度神经网络来预测实足年龄。它经过60000多个样本的训练。研究人员惊奇地发现,该系统识别出五项核心生物指标,预测准确率为81.5%。这一非常新颖且颇具开创性的分析发表在世界著名的研究期刊上。研究成果价值连城,研究人员还受邀参加世界美容创新峰会——深度学习进入美容行业。深度学习需要专门的数据科学人才,而这方面的人才仍然供不应求。目前只有少数公司可以从深度学习中受益,其他公司正在迎头赶上。5.想使用深度学习——但不知道如何开始深度学习已经成为迄今为止使用人工智能构建解决现实世界问题的系统的有效方法之一。互联网时代产生的海量数据越来越多地被用于深度学习。正如记者RobinWigglesworth在《金融时报》中所写:“简单来说,深度学习建立在1990年代神经网络的发展之上,机器使用人工神经元矩阵扫描信息、寻找模式并做出决策,就像Theway人脑可以工作,但速度超快。”深度学习在需要分类和/或预测的领域很有用。任何对商业、工业或研究领域的预测和分类问题感兴趣的人都应该了解深度学习。事实上,如果有足够的历史数据、需要预测或分类的研究案例,就可以建立深度学习模型进行研究。学习新事物最困难的事情是找到易于理解和部署的示例。很容易找到与主题相关的大量技术论文,但很难找到用于快速入门和构建的具体示例。本书就是为了解决这个问题。本书配有直观的插图、实用的示例和简单的模型解释,可以直接用Python构建和测试本书。这使得开始和试验数据和Python变得容易。应用本书中的思想将改变您对数据科学实践的思考方式。即使你只是实现了本书每一章的一个想法,你不仅可以利用深度学习来完成任务,还可以从容应对更多数据带来的机遇和挑战。