当前位置: 首页 > 科技观察

机器学习云平台应该具备哪些特性?

时间:2023-03-18 12:23:52 科技观察

要创建有效的深度学习模型,需要提供大量的数据来有效地训练模型。然后对模型进行拟合、监测漂移,并根据需要迭代地重新训练。模型的训练需要大量的计算资源,如果你投入了大规模的计算资源,你可以在本地完成所有这些工作。然而,你会发现这些计算资源很多时候是不活跃的。如果在云平台上执行上述活动,可能会更划算。大多数云提供商投入巨资构建他们的机器学习平台,以支持整个机器学习生命周期。每个端到端机器学习平台应该提供哪些功能?训练数据模型当你准备了大量的训练数据时,你当然不想迁移数据。因为这个过程通常会花费很长时间,也就是说你在这段时间里不能做任何事情。对于大型数据集,理想的做法是为已经存在的数据创建一个模型,从而避免大量的数据迁移。支持ETL或ELTETL(导出、转换和加载)和ELT(导出、加载和转换)是数据库世界中两种常见的数据配置技术。机器学习和深度学习非常需要这些工具,尤其是转换部分。支持在线模型训练建立一个好的机器学习和深度学习模型需要海量的数据,而将这些数据全部下载到本地进行模型训练是一个非常耗时的过程。而当数据规模达到一定规模后,你会发现很难找到本地资源来存储数据,所以支持在线模型训练是云平台必备的功能。支持scale-up和scale-out训练利用云平台帮助生成多个大型虚拟机或容器环境,在本地notebook加速训练活动,大大减少我们的训练时间。提供优化的人工智能服务云平台为许多应用程序提供强大和优化的人工智能服务或解决方案,而不仅仅是图像检测。这些包括语言翻译、语音到文本、文本到语音、预测和推荐。这些服务经过培训和检查的数据集远远超过企业通常可用的数据集。这些也安装在具有足够计算资源(包括加速器)的服务端点上,以确认在全球负载下的良好响应时间。