,下萨克森州,奥斯纳布吕克,2020年6月19日:MelaniePloppa老师在教室里给小学生上课。由于新冠隔离规定的限制,学校目前必须采取特殊的卫生管理措施。此外,课堂上的学生人数也受到控制。COVID-19疫情全面爆发后,不少在校学生开始在家上网课,但事实证明,这样的远程教学方式确实无法与普通课堂相提并论。人们还普遍认识到,在小组中实际面对面交流问题、讨论想法、确定团队挑战和实现目标的整个过程确实会带来更好的学习成果。没错,不然我们要学校干什么?但同样的互联互通技术能否帮助计算机在构建数据驱动的人工智能(AI)知识库和软件驱动的分析引擎时实现更好的“学习”?效果?机器学习的开放性最近,业界涌现出不少开放的人工智能用例。比如今年6月,Databricks带着开源的机器学习成果正式加入了Linux基金会。Databricks将项目命名为MLflow,反映其以端到端流程的形式提供机器学习功能的基本定位,并希望该项目能够贯穿整个开发生命周期。在机器学习领域,端到端是一个比较流行的表述,主要强调软件工具从开发生命周期的一端到另一端的全面覆盖能力。从术语上看,端到端对整个数据流有如下要求:准备(包括解析数据和去重)、实验阶段、将代码打包成“可重新运行”的形式(可以是系统可以以智能模块的形式自由组合,并实现相应功能的即插即用),最终进入可灵活共享、协作的AI模型。其中最重要的是“协作”部分,即通过开放(本质上是开源)平台和渠道社区共享AI和ML数据集、处理引擎和其他深度学习工具的能力。现在业界普遍认为,这是一种更高效、更自然的机器学习实现方式。Databricks的MLflow项目已经开发了两年,有超过200名贡献者参与其中。将其交给Linux基金会将确保项目本身形成独立于任何特定供应商的发展路径,同时选择开放的治理模式以扩大采用和社区贡献。Databricks解释说,他们创建MLflow的初衷是为了解决机器学习模型开发过程中的“固有复杂性因素”。相信有工作经验的朋友都能感觉到,这样一个涉及机器模型构建、训练、调优、部署和管理的过程,确实是相当头疼的。“社区参与度的稳步增长表明数据团队必须致力于构建未来的机器学习平台,”Linux基金会战略计划副总裁MichaelDolan说。“采用率的提高也意味着我们必须采用开源方法来进行机器学习。”生命周期标准化。我们与世界上许多优秀的开源项目保持着合作关系,相关经验也让我们认识到,开放的治理模式确实可以通过广泛的行业贡献和共识来加速技术成果的创新和采用。”促进数字智能的普及从一定程度上来说,开源代码的发展也能有效促进数字智能的普及。2020年6月,Abbyy发布了NeoML开源代码库,致力于构建、训练和部署机器学习模型。这家在硅谷、俄罗斯、欧洲和远东都有业务体系的厂商一直以来都是专业的文档采集和管理业务,但在最近业务范围扩大后,他们开始为企业客户提供数字智能技术解决方案。NeoML的源代码已经可以通过GitHub轻松获得,它同时支持深度学习和传统机器学习算法。作为一个跨平台的框架,它可以智能优化运行在云环境、桌面和移动设备上的各种应用程序。前面提到的Databricks开放智能技术主要用于大数据处理和云计算“集群”管理,而Abbyy的机器学习模型针对图像处理任务进行了优化,旨在成为运行在任何设备上的预训练模型。提供更好的推理性能。两个项目针对不同的技术用例,智能程度不同,但其核心诉求是充分发挥和回馈开放社区中的贡献者。据Abbyy称,95%的IT经理已经开始关注这一波战略趋??势,他们将开源作为核心任务软件开发的主要方向。Abbyy也将通过开源推动其机器学习框架的快速发展,从而支持AI的不断完善。今天,软件开发者可以直接使用NeoML来构建、训练和部署各种模型,以实现针对对象识别、分类、语义分割、验证和预测等不同业务目标的模型解决方案。Abbyy的AI布道者IvanYamshchikov也公布了更具体的用例。银行可以使用这项技术来开发管理信用风险和预测客户流失的模型;电信公司可以使用它来分析营销活动的具体效果;FMCG)企业可以建立包括人脸识别和数据验证功能在内的远程客户标签解决方案。“通过与开源社区共享我们的框架,开发人员可以实现推理加速、跨平台能力,并充分挖掘移动设备的计算潜力,他们的反馈和贡献将继续完善和改进我们的框架,”Yamshchikov说。这套代码库。我们很高兴看到AI技术的全面进步,我们会努力将机器学习带入更有价值、更有影响力的用例。”打开你的“心”然而,开源真的很棒是AI智能化的必由之路?技术领域不能搞粗暴的民粹主义,封闭的专有圈子也是机器学习技术领域重要的生产力领地,只有不断扩大学习和交流的范围,甚至直接分享具体的学习模型,才能有可能真正实现AI技术的普及,以Abbyy创建的NeoML项目为例,该技术支持开放神经网络交换(OpenNeuralNetworkExchange,ONNX),这是一个可互操作的机器学习模型的全球开放生态系统,主要目的该项目的目的是提高各种工具之间的兼容性,并确保软件开发人员可以轻松地使用正确的工具组合来实现实现预期的功能。微软、Facebook等众多合作伙伴加入了ONNX开源标准。相信未来开放的AI智能会越来越普遍。这或许就是人们常说的“敞开心扉”吧。
