当前位置: 首页 > 科技观察

你知道吗?你的每一次外卖都是与深度学习的美好邂逅

时间:2023-03-13 20:43:45 科技观察

很多同学认为外卖就是线上下单线下配送的生意。商业模式很简单。这种想法是正确的,但却是片面的。它不仅需要技术,还需要用深度学习来解决。那么,为什么送餐需要技术?为什么需要深度学习技术?深度学习对于外卖的价值,大家在简单了解外卖业务的场景和特点后,就能明白需要通过技术手段解决的难点。在业务场景上,有团购、点评、预订、外卖:团购,像过去的美团、大众点评,当然现在这两家在合作,还有之前窝窝、拉手、百度糯米。外卖,像美团外卖和饿了么。评论,就像经典的大众点评,以信息平台的形式为用户提供信息和决策。预订,美团在做很多与订餐相关的业务。事实上,外卖O2O线下场景及其商业模式远比上图复杂。整个外卖行业发展非常迅速。我们2014年的订单量刚刚超过100万,但到今年6月,我们的订单量已经超过1200万。与团购、电商平台相比,外卖业务具有四大业务特征:电商化、运营化、本地化、场景化。首先说说电商,外卖交易是可以关闭的。这与淘宝京东电商的模式类似,但不同的是,它是线上线下相结合,所有提供服务的店铺都是实体店,不管餐饮还是非餐饮。其次是运营的特点,一是内容形式的多元化,包括商户、餐饮、非餐饮,餐饮有很多套餐的组合;从内容的形式可以看出产品的形式,目前还不明显。另外就是运营能力,包括商家自己运营的能力,BD自己运营的能力,骑手自己运营的能力。这些并不完全相同。另一个特点是本地化。对于用户来说,一般只能消费绿区商家提供的服务,这就决定了其供需关系是受约束的。另一块是供需的动态变化。动态变化首先,商家不是24小时营业的,商家的配送距离也是动态变化的。从技术角度来看,满足整个服务的动态变化需要个性化的数据,这是一个很大的挑战。最后一个是基于场景的。上图为24小时外卖订单分布曲线。有两个高峰,一个是午餐高峰,一个是晚餐高峰。这是时间的分期。对于基本的饮食场景,用户饮食的区域性或本地化差异比较大。从这些业务特点来看,一是个性化程度很高,二是精细化需求很大。在时间场景、区域场景,甚至更细化的业务场景上,我们都需要加深细化程度;二是多元化的特点,形式多样,内容多样,供给单位多;而且实时度很重要,配送的距离是实时变化的,我们需要做实时监控。根据这些业务的特点,我们需要什么样的基础工具来解决这些技术挑战?下面简单介绍一下美团点评整个大数据平台。美团点评的大数据平台架构美团点评的大数据平台架构,第一层是美团的基础设施,美团有自己的云平台,所以所有的服务器都在云平台上。云平台之上是HDFS等基础服务和Hbase等相关基础设施。上层是机器学习平台,相应部署非线性量化工具。最上面是美团点评的几大业务群,包括酒店和旅游业务,娱乐等综合业务,以及整个公司的广告平台。在主架构之上有一个日志平台。因为业务很多,业务产生的数据,不管是B端还是C端,很多数据都会统一在Log平台上,Log平台会和顶层打通商务平台。另外就是监控平台,服务监控,数据监控和业务调度。美团点评深度学习应用实践接下来简单介绍一下美团点评深度学习的两个关键应用场景。应用场景一:图片技术美团平台的技术内容多种多样,有图片,也有文字。特别是当用户在手机上做出很多决定时,图像对他们的决策至关重要。在图像方面,我们做了两个关键的事情,一个是画质技术,一个是OCR技术。画质技术的应用场景有哪些?如上图所示,左边的图明显看起来更舒服,而右边的图看起来比较凌乱。具体来说,左边的两张图片可能有更高的清晰度或更高的完整性。当用户做决策时,如果我们在平台上发布高质量的图片,用户点击速度会更快。对于商家来说,用户很容易进行需求匹配转化。但就右图而言,改造整个体验的能力会比较弱。基于这样的背景,我们对图像质量进行判断,发现存在一些关键的难点和挑战。关键有3点:标准评价难,包括定义其清晰度、完整性、图像的构图。图像质量没有标准定义。用户有不同的关注点。有的用户可能会关心图片是否清晰,有的用户关心图片是否完整,是否有关键信息需要切掉。手动标记很昂贵。如何解决这些问题?我们引入了一种建模方法,一个像美学课程,一个是图像的基本特征,我们使用自动标记来进行样本标记。我们来看看图片的来源。直观的理解就是用户自动上传的图片,也就是UGC的图片,质量比较差。我们专业人员制作出来的图片质量会更好,可以做一些基本的标注。另一种是基于用户行为。我们会向用户展示点击次数多的图片,这些图片可能是用户感兴趣的或者质量更好的。以自动方式注释样本。在图片输入中,我们并没有直接对每张图片进行区分是高质量、中等质量还是低质量的图片。基本上我们用了一种学习的方法,比如图片的美感,通过DNN的方法对图片进行判断,包括它。属于快餐、西餐或简餐的范畴。另外一块是基本特征,图像的颜色,包括图像的对比度。这些基本特征也可以用于整个建模,还有另外一块深度学习,我们直接去做,通过KOS判断哪个画质好哪个画质差,最重要的是Select从一堆图片中选择一张更好的图片来展示给用户。涉及的数据比较商业化。整体来说,建模完成后,我们的用户体验得到了提升。应用场景二:OCR技术前面是整个图像质量的技术,接下来说说OCR技术。OCR用于数据检测。OCR在美团外卖的重点应用有哪些?更大的方面是自动审查。为了确保为用户提供可靠或优质的服务,我们需要审核商户的执照。如果商家的营业执照和产品质量都由人工审核,人工成本会很高。另一部分是自动输入。商家在外卖平台打卡后,需要在上面录入菜品。特别是,商家必须不断地更换菜单和进入菜单。这部分是自动输入的过程。这是两个基本的应用需求点。图像的成像方法有很多种,另外一段文字就很复杂了。许多图片上的文字不是标准斜体。各种乱七八糟的字体都有,甚至还有乱七八糟的字体。这种场景很难区分,对整个OCR提出了技术挑战。如何解决这些问题?OCR识别技术是我们发现的关键技术。文字检测从图片开始。比如我们检测图片中哪部分是文字,哪部分是图片本身。另一部分是文字识别。我们检测完图片之后,如何识别里面的文字。这部分整体采用了CNN方法,加入了BLSTM模式,考虑了整个序列建模的能力。最后一部分是CTC序列识别模型。我们的整个流程从人工审核变成了自动化流程,整体运营效率得到了很大的提升。DNN在美团点评评价模型中的应用接下来我们将详细介绍DNN在评价模型中的应用,包括上面提到的会涉及到很多的评价,而评价在整个算法领域应用广泛,比如广告中涉及到的CTR预估。如果我们的优化目标可能是CTR,就是CTR的预估,还有很多ROI的预估。近年来,国内外各大互联网公司都在研究基于DNN的模型。如何改进原有传统模式中可能存在的一些不足,是我们正在做的一些相应的探索。首先,简单介绍一下我们的商业模式。上面介绍了业务的特点。根据业务特点,用户模型是什么?有几个关键步骤。用户在做出决定时看到相关信息后,这是否是用户的目标需求决定了用户的消费。决策。先点击,然后进入商家的下单页面。您可以添加或减少菜品,然后用户可以提交订单。提交后,用户有一系列的输入,地址等,然后就是支付,然后进入商户系统。整个过程就像一个漏斗,其中每个场景都有相应的变换,我们可以进行估算,或者对整个环节进行完整的估算。另一部分是在这样一个预测模型中,我们通过多个维度的特征来表达这个样本,我们使用一定的学习模型来得到最终预制的结果。在外卖场景中,特征的维度更加复杂。上面提到的用户特征是最基本的。另一部分包括场景层位置、不同建筑类型、不同用户需求的特点,包括时间和餐饮。特性,用户肯定倾向于提供更快的结果。这分为不同的业务场景。例如,如果您在12点订午餐,您可能希望它在十分钟内送达。如果想吃水果,可以等三个小时。什么是特征组合?二是商家的特点。最重要的是商家提供的产品。采用直销模式,每家实体餐厅包括餐厅的品质和整体的转化能力。其中,操作能力有很多特点。还有产品的特点。从这个角度来看,在定义特征的整个过程中,有很多特征,那么多维度可以切出不同的模式。如何定义特征,如何组合特征,成本非常高。这个过程取决于人工经验。个性化推荐在整个行业的效果更好,为什么效果更好?除了更好的技术外,业务领域还定义了很多特性。除了对技术本身的深刻理解,还有很多业务上的特点和经验。另一部分是特征选择非常大。特征多了之后,特征选择的代价就非常高了。如何挑选有价值的。刚刚提到的重点是DNN擅长的能力。为什么我们要尝试很多DNN?一方面,传统模型已经研究多年,另一方面,传统模型存在一些不足。它的优点是速度非常快。它基本上是一个线性模型。我们用了上千亿的特征,但是它的缺点是因为是线性的,所以它的非线性能力比较弱。但实际场景并不是简单的线性化,而是非线性的,甚至更复杂的构图。另一块是线性的,所以最基本的逻辑就是它是一维的,我们每个人都需要手动组合特征。组合特征涉及手动安排。如果我们准备三个,我们将使用三个。它很复杂,因此特征组合的成本很高。树模型的应用树模型可以解决特征组合的问题。同时,它也可以解决整个树空间的问题,让整个空间成为多维的,而不是简单地通过线性分割,所以它解决的是有限线性能力的问题。例如,上述经营类型包括快餐、简餐、西餐;另一个是文本特征,它不太擅长树模型,所以我们尝试基于此的多个DNN模型。整个系统的架构分为两大层次。首先是基础数据层,包括用户来之后的APP,包括我们的API和很多业务数据。以上分为两部分,一是离线数据处理,一是在线实时数据处理。离线数据有几个关键步骤。其他网上的整个逻辑都是类似的。核心逻辑部分是包括端到API,API到后期服务。用户使用的是技术还是某条线路,取决于业务的特点。规则是要排序的。我们来看看整个系统在外卖中的关键特征,一个是用户维度,一个是商家维度。从用户画像来看,一个是基础用户是男生还是女生,或者行业是学生还是白领,有什么喜好,喜欢粤菜还是京菜,以及有额外的购买力。一百元或者二十元,还有很多优惠信息。商户层包括商户的基本信息,还有商户使用的第三方配送,好用的美团点评。因此,交货的及时性存在很大差异。这是一个单独的功能。此外,还有各种特征和关联特征的组合。比如用户浏览、点击、下单的次数,对应的点击率,交叉特征很多。在熟悉了政策体系之后,我们首先尝试了谷歌经典的DeepModel,它分为两部分。输入特征后,我们进行最佳预测得到相应的结果。下面简单介绍一下,wide部分可以输出单个特征,也可以输出特征组合,需要将特征转移到一个模型空间中。深部可以根据业务特点尝试或调整参数。另一部分是制作功能时。虽然是高维的,但是可以从高维空间转移到低维空间。这部分是更详细的图片。这张图中,我们有分层的特征,也是可以做到的。比较灵活,可以在不同的厂家,也可以让一些厂家介入最后一层逻辑回归。在建模的过程中,关键是离线。离线是样本处理,包括样本清洗和爬虫过滤。现在有很多爬虫,这些爬虫的数据对整体效果影响很大。另外还有无效加载,素材的优化,小样或者子样的价格怎么调整都是很重要的,我们采用用户点击的概念来做。业内使用较多,即使是新用户,也是在打折的时候才会下单。这是表达他们兴趣的内容。我们做了一些筛选,选择频率相对一定的用户或者产品作为整个样本。空间,准确的数据。上面提到的模型将不同的特征划分为不同的层次。不同的模型采用不同层次的划分,特征能力比较强。但是,你也可以看到之前的模型使用了特定的特征,而没有考虑实际的序列特征。事实上,当用户进入一个场景时,无论是电商产品还是外卖产品,用户肯定都会有一系列的行为。比如在最终下单之前,还需要构建实际序列,同时将实际序列作为每个时间段的输入,同时在每个时间段做相应的特征项时间段,最终做出完整的预测得到相应的结果。这是使用经典RNN的模型。大家可以试试长短序列机的模型。因为这块涉及到用户的实时架构,所以简单介绍一下我们实时系统的架构。基本上,首先是用户个人行为的数据。输入序列后,根据数据进行相应的排序。从整个KV结构来看,我们需要同时监控多层指标,看数据是否正常,日常数据如何处理。下面简单介绍一下用户的信息。一种是输入,可以根据不同的应用场景进行选择。其实在点击用户场景下可以点击用户观看。同时,每个输入都需要对应的one-hotinput。输出也可以是序列,可以根据实际场景进行控制。当我们按照概率选择序列时,我们会按照一定的概率顺序给用户一个对应的序列结果,准确识别用户的需求。其中,关键点是序列的长度。序列的长度根据不同的业务方式进行调整。如果序列太长,一方面可能非常稀疏,另一方面计算时间非常高。如果序列太短,将无法充分挖掘用户的信息,需要根据一定的时间窗口做出相应的选择。最后的好处就是我们给用户的推荐结果的准确度有了很大的提升,整个平台的转化效果和收益都有了提升。结语对于外卖来说,生意很重要。如何达到最终效果?不仅要从技术角度去理解,还需要对业务有更深入的理解。了解业务后,我们需要决定用什么技术来解决这个问题。问题。另外,在算法选择上,在整个算法中,要一下子找到一个强大的方法,需要多次尝试。我们需要尝试很多模型,同时我们需要做一个总结,什么样的场景,什么样的问题使用策略比较合适。