人工智能正在席卷全球。人工智能的重要分支之一——计算机视觉,也如雨后春笋般涌现,新的思想、理念不断涌现。应用。人脸识别已经逐渐渗透到我们的日常生活中。大家一定听说过机器可以识别人脸。另一种计算机视觉应用是产品识别。目前,一些新兴的无人零售店需要机器自动识别商品,拍照购物、AR互动营销等场景也使用了商品识别技术。人工智能商业公司ImageDT,利用商品图像识别技术,提供2B商业服务,包括基于互联网图像大数据的商业分析,基于门店货架识别的渠道数据洞察,帮助消费品企业提升业绩。今天,图匠将与大家分享商品识别技术在无人店和新零售中的应用。数据逻辑1、让孩子“记住”超市里的所有商品。我们在教孩子认识物体时,比如“苹果”,先让他反复看“苹果”,让他认识“苹果”;他可能弄错了,把“梨”误认为是“苹果”。这个时候,他应该指出来。孩子看到的“苹果”越多,识别它们的能力就越强。基于深度神经网络的人工智能使机器具有理解能力。基本过程就像教孩子认苹果一样。第一,数据量要大,比如“苹果”图片;同时,机器会错误识别的大量“负样本”,例如“梨”图片;然后通过深度神经网络,反复学习,最终得到一个有效的识别模型。对于快速消费品的识别,我们不仅要识别瓶子包装,还要识别一瓶酸奶或啤酒;不仅要认酸奶,还要认酸奶是什么牌子,甚至是什么口味,什么规格。这是一个极其庞大和复杂的人工智能项目,旨在使机器能够准确识别数千种快速消费品SKU。数据收集2.让机器获取学习的原始资料。首先,我们需要整理出所有的目标商品列表,并尝试获取每个商品的图片数据。根据产品的特征识别,通常需要几十到几百张有效图片。数据收集是一组组合。电商平台有结构化的产品介绍图片和大量的买家图片,社交平台也可以获得大量的消费者图片,是性价比最高的数据来源。超市真实货架数据是最可靠的数据来源,但采集和后处理成本相对较高。此外,ImageDT还自主研发了智能灯箱和智能采集车,模拟各种场景拍摄360°的产品,建立庞大的训练数据库,从而获得最丰富的训练数据。数据标注3.需要多少人工智能来采集原始图像数据,这些原始图像数据通常夹杂着大量需要清洗的“脏数据”;在大多数情况下,还需要对图像中的对象进行标记和分类。只有可靠的数据才能产生高质量的识别模型。在每一个人工智能公司里,都有一支专门的军队——数据标注团队。ImageDT也不例外。这个团队的背后是一个充满黑科技的标签系统。比如图片通常在标注之前先用弱模型处理,让机器先解决50%的问题;系统有小图模式,支持批量贴标,贴标员一眼就能看到十行,贴标速度翻倍;产品经理反复打磨每一个功能,做A/B测试,从每一个细节提升标注的体验和效率。此外,标注团队还针对不同的任务配置了不同级别的质量保证机制,包括抽样审核、全员审核、交叉检查、埋点检查等,确保为机器学习提供最准确可靠的训练数据。模型训练4.“Liveandlearn”,机器必须不断学习和准备数据。下一步是让机器学习并建立识别模型。对于相同的数据,选择不同的神经网络算法和不同的参数设置都会影响最终模型的效果。模型建立后,需要进行管理:模型之间存在层级关系,数据和模型之间会有版本迭代。这些问题在遇到大量商品类别时是非常困难的。在ImageDT内部,有一个自助式的深度学习平台,支持算法拖拽和参数测试。即使是非程序员也能傻傻的完成一个建模任务,得到一份模型效果评估报告。ImageDT的每一位新员工,无论是工程师还是前台,都会接受半小时的建模培训;训练结束后,每个人都能独立搭建图像识别模型,整个过程仅需半小时。同时,深度学习平台就像一个模型仓库,兼顾对象、数据和模型的管理。整个建模流程已经标准化,最快只需一天时间即可完成从数据采集、标注、建模到上线的全过程。ImageDT的研发团队分为四个组,产品组、建模组、数据组和研究组。前三组负责流水线的建设和运营,让每天有条不紊地建立大量新的商品识别模型,并快速上线对千万级图像数据进行识别分析每天。研究团队要攻克各种疑难杂症,比如软包装容易起皱、产品侧面和背面的识别、遮挡和反光环境下的识别等等。目前在实际生产环境中,识别准确率已经达到95%以上。人脸具有固定的眼睛、鼻子和嘴巴等特征,而超市中的商品种类繁多。与人脸识别相比,商品识别的工程复杂度更高。ImageDT正在做的就是实现这个庞大的AI工程,让机器自动准确识别每一个产品。零售智能货架演示
