Facebook可以教给我们很多关于高效人工智能的知识。Gartner最近的一项调查显示,许多公司才刚刚开始他们的机器学习之旅,37%的组织已经实施了人工智能。如果您已准备好接受机器学习,您可能需要先评估十个问题或评估人工智能、机器学习和深度学习的完整指南,然后再对机器学习进行概念验证。机器学习在不断发展,新的业务突破、科学进步、框架改进和实践经常被各大媒体报道。我们可以从实施大规模机器学习计划并将AI置于其业务核心的组织中学到很多东西。在纽约的O'ReillyAI会议上,我看到了Facebook机器学习计划中的几个共同趋势。了解业务需求和竞争因素Facebook在许多领域使用机器学习。在Facebook的主页上,机器学习可以搜索内容、翻译语言、扫描NewsFeed和识别用户上传照片中的人脸,以及检查显示的广告。在幕后,机器学习用于内容理解、语音识别、内容完整性、情绪分析、不良内容检测和欺诈账户。同样,推文排名、广告选择、搜索功能和用户推荐等一系列活动证实机器学习正在发挥作用。机器学习还用于标记不适合工作的亵渎性推文、垃圾邮件和图像。每个机器学习操作的规模以及两家公司以何种方式投资于差异化能力的方式不太明显。Facebook每天为26亿用户执行超过200万亿次预测。它的用户遍布世界各地(带宽有些受限),而且很多交互都是在手机上完成的。这带来了一些难题,因为61%的全球用户仍然拥有一部使用了6年或更久的手机;不到10%的人使用高级智能手机。Facebook的部分战略是将更多的神经网络计算转移到边缘设备,以增加规模、降低延迟并提供更个性化的机器学习模型。Facebook的机器学习堆栈体现了让研究新模型变得容易的目标,同时提供大规模的推理结果并将一些计算卸载到边缘设备。针对大小和延迟要求优化模型。它每秒执行数千万次预测,每天在数十TB的数据上训练模型。它专注于优化延迟(模型响应所需的时间)并指定预测延迟的预算,即预测延迟数十毫秒所需的预算。标准化规模化平台Facebook有一个早期的机器学习计划。他们从非结构化方法开始,但他们现在正在采取措施标准化平台、框架和管道。Facebook正在解决各种痛点,即可靠性、可扩展性、运行模型的效率以及科学家和工程师的开发体验。两家公司的平台都根据类似的数据管道处理原理进行了优化,都拥有处理数据、提取特征、训练模型和将模型部署到生产环境的平台。两家社交媒体巨头正在采取措施对选定的机器学习框架进行标准化。Facebook正在使用PyTorch来简化研究,并使用Caffe2来大规模运行生产推理模型。它将Caffe2集成到PyTorch1.0中,结合了这两个特性,并使用Caffe2Go运行移动神经网络。使科学家、开发人员和工程师能够协作Facebook概述了各种不同的努力,以提高数据科学家、开发人员和工程师之间的生产力、知识共享和代码可重用性。许多数据团队使用数据目录和字典作为其数据治理计划的一部分。这些工具使每个人在使用数据进行分析或机器学习实验时更容易理解底层数据模型、字段定义和质量约束。Facebook还对自己的能力进行分类和标准化、自动化培训并开发用于管理和部署模型的工具。FBLearner是支持这些功能的标准平台。此外,Facebook正在对其使用的机器学习类型进行标准化。例如,新闻源、广告、搜索和异常检测中的排名使用多层感知器。Facebook还使用卷积神经网络和支持向量机进行面部识别,并使用递归神经网络进行语言翻译。使机器学习模型的持续训练自动化像软件应用程序一样,机器学习模型必须不断训练和修改。Facebook将此培训自动化,以便根据新数据重新调整模型。Facebook专注于其战略。频繁变化的模型(例如新闻提要)每小时或更短时间重新训练一次,而语言翻译和面部识别模型则以数周到数月的周期进行训练。计算成本和计算资源量也决定了模型重新训练的频率。Facebook可能具有战略计算优势,因为它开发了各种针对不同机器学习工作负载进行优化的硬件堆栈。因为全世界的计算资源都没有得到充分利用。制定长期计划从小处着手,训练模型并使其在生产中运行以证明其商业价值,然后努力扩展实践并使其更加成熟。与应用程序开发类似的纪律对于实践的成熟至关重要,包括标准化框架、定义架构、选择维护周期、优化性能和自动化部署管道。您会发现机器学习带来了巨大的价值,但它也需要持续研究以根据性能和投资进行改进。训练、部署、优化各种模型,然后用更好的模型替换。机器学习是一种新的工具和技能,但对于必须改善用户体验或必须通过数据增加竞争价值的组织而言,它们将变得越来越重要。
