当前位置: 首页 > 科技观察

5个关键步骤!如何建立深度学习模型?

时间:2023-03-19 00:50:10 科技观察

本文转载自公众号《核心阅读》(ID:AI_Discovery)。人们对深度学习的兴趣持续上升,这是机器学习的一个子领域,基于人工神经网络的概念来执行特定任务。然而,从理论上讲,ANN的工作方式与人脑不同,甚至与人脑的工作方式不同!它们之所以被命名为ANN,是因为它们可以完成准确的任务,同时达到所需的精度水平,而无需使用任何特定规则进行显式编程。几十年前人工智能失败的主要原因是缺乏数据和计算能力。在过去的几年里,这种情况有了明显改善。基于大型科技巨头和跨国公司对AI数据的投资,数据的丰富性显着增加。鉴于图形处理单元(GPU)的强大功能,计算能力不再是一个挑战。本文将详细讨论构建深度学习模型的五个基本步骤,以及如何使用这些步骤来处理各种深度学习项目。1.定义架构深度学习是解决图像分类或分割、人脸识别、物体检测、聊天机器人等复杂任务的最佳方法之一。然而,对于每一个复杂的项目,深度学习模型都需要经过五个完成当前任务的固定步骤。构建深度学习模型的第一步也是最重要的一步是成功定义网络和架构。根据正在执行的任务类型,通常会偏爱特定类型的架构。通常,对于图像分割、图像分类、面部识别和其他类似项目等计算机视觉任务,首选卷积神经网络(CNN)或ConvNet。而对于自然语言处理和与文本数据相关的问题,循环神经网络(RNN)和长短期记忆(LSTM)更可取。在这一步中,还可以为整个深度学习架构决定模型构建结构的类型。执行此操作的三个主要步骤是顺序模型、功能API或用户定义的自定义模式。下面将更详细地讨论每种方法。2.编译模型首选架构的构建完成后,将继续构建模型的第二步——编译模型。编译步骤通常是TensorFlow深度学习框架中的一行代码,可以使用model.compile()函数进行编译。在深度学习中,编译的要求是对模型进行配置,以便顺利完成拟合/训练过程。在编译过程中,为评估程序定义了培训程序的一些关键组成部分。枚举一些必要的参数,下一步是分配损失、优化器和指标。磨损的类型取决于遇到的问题类型和需要立即解决的问题。优化器通常参考adam、RMSprop或类似的计算;指标是指准确度指标或任何其他用户定义的分析度量。3.拟合模型图源:在unsplash成功定义了整体架构并编译了模型之后,逻辑上的第三步就是在训练数据集上拟合模型。fit函数训练模型固定数量的时期(数据集上的迭代)。借助拟合函数,可以确定重要参数,例如训练时期数、输入和输出数据、验证数据等。拟合函数可用于计算和估计这些基本参数。在训练期间,必须不断评估拟合步骤。重要的是要确保经过训练的模型表现良好,同时提高准确性并减少整体损失。同样重要的是要考虑模型不会以任何方式过度拟合。为此,必须使用Tensorboard等工具进行持续评估,以分析各种图表并查看模型是否存在过度拟合的风险。完成训练并分析固定数量的epoch后,您可以继续执行第四步-评估并使用经过训练的模型进行预测。4.评估和预测评估深度学习模型是验证构建的模型是否按预期工作的重要步骤。构建的深度学习模型在实际应用中可能表现不佳。因此,评估深度学习模型变得至关重要。评估深度学习模型的主要方法之一是确保在预处理步骤开始时考虑模型对测试数据拆分的预测,以验证训练模型的有效性。除了测试数据,模型还必须用可变数据和随机测试来测试模型,以查看其在未训练数据上的有效性以及其性能效率是否符合预期。假设我们建立一个简单的人脸识别模型。考虑到模型已经用图像训练过,并尝试在测试数据和实时视频记录中评估这些具有不同人脸的图像,以确保训练好的模型运行良好。5.部署模型部署阶段是构建任何模型的最后一步。成功构建模型后,如果您想保留模型或将其部署到更广泛的受众,这是一个可选步骤。部署方式不同。可以作为跨平台应用进行部署,也可以使用亚马逊提供的AWS云平台进行部署,也可以使用嵌入式系统进行部署。如果你想部署像监控摄像头这样的东西,你可以考虑使用像树莓派这样的嵌入式设备和摄像头模块来执行这个功能。具有人工智能的嵌入式系统是部署物联网项目的常见方式。在使用flask、Django或任何其他类似框架构建深度学习模型后,您还可以选择将这些深度学习模型部署到您的网站上。另一种有效部署模型的方法是为智能手机用户开发安卓或iOS应用程序,以覆盖更广泛的受众。来源:unsplash要构建任何深度学习模型,您需要遵循这些步骤,包括上述五个中的至少四个。对于新手或初级项目来说,部署步骤是一个可选步骤,但在相关行业和公司中,这一步极其重要,不可或缺。需要注意的是,在构建和使用深度学习模型之前,必须考虑数据预处理、探索性数据分析和其他强制性清理步骤。模型构建步骤必须在所有数据预处理完成后执行。