小米开源自研移动端深度学习框架MACE♂6月28日,小米人工智能与云平台副总裁崔宝秋博士在开源中国开源世界高峰论坛上发表演讲并发表演讲。会上宣布开源小米自主研发的移动端深度学习框架MobileAIComputeEngine(MACE)。 地址:https://github.com/XiaoMi/mace 近年来,随着移动互联网的深入发展和物联网智能设备的普及,以及用户对物联网的需求不断变化智能、低延迟和隐私保护移动设备上的离线深度学习应用越来越普遍。 据雷锋网介绍,MACE是一款针对移动设备优化的深度学习模型预测框架。MACE从设计之初就针对移动设备的特点进行了专门优化:模型一般对整体预测时延要求非常高。在框架的底层,针对ARMCPU进行了NEON指令级优化,针对移动GPU进行了高效的OpenCL内核代码。对于高通DSP,集成了nnlib计算库,用于HVX加速。同时在算法层面,采用Winograd算法加速卷积。功耗:移动终端对功耗非常敏感。该框架针对ARM处理器的big.LITTLE架构,提供高性能、低功耗等多种组合配置。对于AdrenoGPU,提供了不同的功耗和性能选项,让开发者可以灵活调整性能和功耗。系统响应:针对GPU计算模式,框架底层自适应拆分调度OpenCL内核,保证GPU渲染任务更好的抢占式调度,从而保证系统的流畅性。初始化延迟:在实际项目中,初始化时间对用户体验至关重要,框架会相应地对其进行优化。内存占用:通过分析模型算子的依赖关系,引入内存复用技术,大幅降低内存占用。机型保护:对于手机机型来说,知识产权的保护往往非常重要。MACE支持将模型转换为C++代码,大大增加了逆向工程的难度。 另外,据了解,MACE支持TensorFlow和Caffe模型,并提供转换工具,可以将训练好的模型转换成专有的模型数据文件。同时,您还可以选择将模型转换为C++代码,并支持生成动态库或静态库,提高模型的保密性。 目前MACE已经在小米手机的多个应用场景中应用,包括人像模式、场景识别、图像超分辨率、离线翻译(即将推出)等。 此外,与MACE一起,MACEModelZoo项目也是开源的,目前包括物体识别、场景语义分割、图像风格化等多个公共模型。将来会添加更多模型。上面 是使用MACEModelZoo中的快速风格迁移模型在手机端生成的风格化图片。 据雷锋网了解,小米此前参与了Hadoop、HBase、Spark、TensorFlow等多个国际重大开源项目,同时,小米也积极参与自研和通用软件系统。过去几年,小米先后推出了Linden(分布式实时搜索系统)、Open-Falcon(互联网企业级监控系统)、Pegasus(分布式KV存储系统)等一系列开源项目。 在AI方面,小米开源了自主研发的针对移动设备优化的深度学习框架MACE,目前支持内部多项业务。 另外,雷锋网将于6月29日至7月2日在深圳举办CCF-GAIR大会。小米高级架构师、小米AI与云平台副总裁崔宝秋将作为嘉宾出席并发表演讲。 全球人工智能与机器人峰会(CCF-GAIR)由中国计算机学会(CCF)主办,雷锋网、香港中文大学(深圳)承办,得到深圳市政府的大力指导政府。是产业、产业、投资三大领域的国际交流盛会,旨在打造中国人工智能领域最具实力的跨行业交流合作平台。 CCF-GAIR2018延续前两届“***”阵容,提供1个主会场和11个专场(仿生机器人专场、机器人行业应用专场、计算机视觉专场、智能安防专场、金融科技专场、智能驾驶专场、NLP专场、AI+专场、AI芯片专场、物联网专场、投资人专场)丰富的平台,意在为与会者呈现更具前瞻性和实用性的产学研结合会议内容和现场体验.
