从提高运营效率到实现持续创新,机器学习成为企业发展的关键。然而,据IDC发布的《2020年人工智能战略观察:执行摘要》,目前全球只有约四分之一的人工智能和机器学习技术解决方案用于生产,这表明许多公司并未充分受益于该技术。如果组织能够快速实施和扩展机器学习模型以支持整个企业的应用程序,那么他们只能利用机器学习来释放真正的商业价值。然而,大规模部署机器学习模型也会给企业带来许多挑战。例如,大规模部署需要“从数据到模型再到结果”的复杂迭代的端到端工作流程。此外,企业还需要提升自身治理能力,合理应对模型部署对终端客户服务的影响(如隐私问题),关注数据应用的合规性和安全性,以及模型是否可以被公开。转化为生产级模型等机器学习的实现依赖于数据由于机器学习技术是数据驱动的,因此不存在数据过载问题。事实上,随着摄入数据量的增加,机器学习工具可以变得更加准确。随着人、企业和城市之间的联系越来越紧密,世界将继续产生大量数据,为使用机器学习的企业提供更多优势。但由于机器学习依赖于数据,组织需要具备更好的数据管理能力,尤其是当数据需要在多个不同的平台上生成、存储和处理时。根据IDC发布的《2020年全球企业上云预测报告》,今年亚太地区超过90%的企业将选择应用由本地或专用私有云、多个公有云和传统平台组成的混合环境。因此,对于组织而言,平台之间的数据迁移以及跨所有平台的数据保护和管理都可能带来挑战。随着5G和物联网的兴起,企业需要有效地管理流数据以及存储在数据库中的静态数据。由于联网设备需要根据实时洞察力做出决策,因此流数据对于在网络边缘运行的机器学习系统尤为重要。此外,同时具备知识和实践经验的机器学习运维人员仍然短缺,这也可能阻碍组织向数据洞察驱动的转型。为了应对这种情况,企业可以适当降低数据访问门槛,让更多员工参与进来,在各个流程中进行数据化决策。当然,这种方法需要有效的数据治理来确保数据的一致性和可靠性,并避免数据滥用。企业数据云赋能数据治理由于机器学习系统生成的洞察力的可靠性完全取决于企业数据的质量,拥有强大的数据治理能力是在企业组织中成功扩展机器学习的关键。只有确保数据满足准确性、及时性和相关性的特定标准,业务用户才能依靠数据治理做出明智的决策。同时,这降低了成为数据泄露和违反数据隐私法等法规的受害者的风险。由于数据分布在不同的平台上,组织可能难以使用传统或基于点的数据管理解决方案有效地实施数据治理。企业数据云可以提供从数据采集、丰富、报告、服务到分析预测的端到端互联互通的数据生命周期解决方案,该解决方案可以运行在多云和混合云环境中,帮助企业进行数据治理。它还提供一套集成的基于元数据的安全治理技术,为所有分析功能提供持久环境。基于上述解决方案,组织可以确保对数据的访问,同时确保数据使用始终得到授权、跟踪和审计。ClouderaDataPlatform为机器学习奠定基础选择合适的技术平台对于机器学习操作至关重要。ClouderaDataPlatform(CDP)等企业数据云可以帮助组织完成基础技术平台的搭建。借助CDP,组织可以获得其数据的整体视图,以便在需要更多容量时将本地工作负载批量迁移到云端,并分析和优化所有位置的工作负载。此外,这些组织可以降低风险和运营成本,因为企业数据云支持整个数据生命周期的安全治理和合规性。CDP的在线共享数据体验(SDX)提供了一套集成的基于元数据的安全治理技术,以统一的方式管理和维护所有用户、分析和环境(本地、私有或公共云)的数据访问和安全性。治理战略。在能够更好地管理数据之后,组织还可以在机器学习服务之上构建机器学习操作(MLOps)层。MLOps是数据科学家和运维人员之间管理机器学习生命周期的协作和沟通实践,旨在减少模型投入生产的时间和难度,减少摩擦并增强团队之间的协作,并改进模型跟踪、版本控制、监控和管理。而且,它有助于为现代机器学习模型创建真正的循环生命周期,并标准化机器学习过程,为日益严格的法规和政策做好准备。目前,很多企业组织都选择了ClouderaDataPlatform(CDP)来加强数据治理能力,拓展机器学习应用。以大华银行(UOB)为例,通过使用CDP,成功集中了合规、零售银行、资产管理和批发银行等各业务部门的数据,获得了更全面的客户数据和交易数据。此外,在帮助大华银??行确保数据治理的同时,CDP还有效地将人工智能和机器学习技术推广到更多的业务环节,支持超过150个大数据分析沙箱,让超过200名用户能够测试想法和基于数据的创新。总体而言,该解决方案通过更有针对性的优惠和推荐带来了商业利益,例如缩短反洗钱检测时间和提高客户转化率。结论机器学习技术必将推动企业组织的变革,许多机器学习应用已经为企业组织带来了实际的业务成果。机器学习可以使流程自动化并发现新的见解,从而帮助公司创造新产品或增强现有产品和服务以提供更好的客户体验。然而,数据质量差和无法访问相关数据可能会阻碍企业采用机器学习。因此,企业还需要完成全方位的运营转型,具备机器学习模型的构建和开发能力,以及整个模型的部署和运营能力,从而充分挖掘机器学习的潜力。
