长期以来曝光度很高,一直备受关注。人工智能在电商搜索领域扮演什么角色?Etsy数据科学总监洪良杰以案例为基础,从人工智能技术在电商中的基础应用出发,电商人工智能技术与传统领域的异同点等,为大家带来了标题为“人工智能技术在电商搜索中的应用”的干货分享。人工智能在电子商务中的应用人工智能技术在电子商务中的基本应用可以分为三个方面,即搜索、推荐和广告。主要目的是让顾客更容易买到他们想要的产品。电商最重要的是能否利用自己的搜索、推荐、广告平台,让客户更快速、更有效地购买产品。其次,与传统平台相比,电商必须具备这个功能——发现,其目的是帮助用户找到目前不想购买但仍有购买潜力的商品。假设将电商购物与线下购物体验进行比较,当普通人在线下购物时,商家不一定会将顾客喜欢的商品放在外面,那么顾客会有一定程度的不购买,不会购买在很短的时间内。离开商场。对于购物中心,他们希望顾客在这段时间能多停留,多光顾商户;作为用户,虽然大部分用户可能不会在最佳时间购买商品,但这并不妨碍这些用户享受这样的购物环境。如何将线下购物场景应用到线上购物?这是当前电商平台需要考虑的问题,也是人工智能应用面临的一个比较巨大的挑战。电子商务人工智能技术与传统领域的异同就搜索应用而言,电子商务搜索与普通搜索的最大区别在于购买过程和发现过程的建模。普通搜索模式更喜欢用户在搜索页面本身停留的时间尽可能短,更喜欢用户只点击搜索页面的首页,而不是翻到第二、第三页。将最相关的内容放在首页顶部的目的是让用户在点击首页搜索结果后快速离开,将用户的操作过程控制在30秒以内。相反,它希望用户能够一遍又一遍地执行此搜索交互。电子商务搜索与普通搜索有很大不同。传统搜索中最重要的相关性并不是电商搜索的整体,而只是电商搜索的一个方面。而电商搜索更需要关注的是整体利润,能否通过搜索产生收益。电子商务搜索的最终目的是增加用户的购买需求,其次是激发用户潜在的购买欲望。因此,与传统搜索相比,电商搜索具有更多“如何实现利润最大化”、“如何激发用户潜在购买欲望”等维度。就推荐应用而言,目前的推荐体系比较完善,涌现出很多推荐方案。但是电商推荐和传统推荐有什么区别呢?现有的推荐模型都是基于协同过滤(CollaborativeFiltering),一般的协同过滤是根据用户过去的行为来预测和推荐未来的行为。以视频网站为例。假设你在某个视频网站浏览过某部电影的第一季,这个视频网站会为你推荐这部电影的第二季和第三季。但是如果在电商场景下,假设用户已经购买了某个商品,而电商推荐系统继续向你推荐同一个商品,就会暴露这个系统的不智能。因此,协同过滤技术不适用于电子商务推荐,需要根据电子商务的特殊属性对推荐系统进行较大的调整。电子商务的最终目的是让用户购买商品,通过推荐使商家的利润最大化。这就需要在以往的推荐系统中加入更多的元素。比如库存要素,假设商家向很多用户推荐一个只有少量库存甚至唯一库存的产品,一旦产品售出,其他用户的体验就会很差。如何利用库存实现更好的交互体验,是电商搜索需要关心的内容。就广告应用而言,电子商务的广告系统是一个二元信息广场系统。对于卖家来说,更希望通过广告费用让自己的产品出现在搜索页面的靠前位置。对于平台来说,通过帮助卖家获得更多的点击量来收取一定的费用。对于买家来说,即使搜索页的前几个位置是广告位,也不会让用户产生反感,因为买家的最终目的是购买适合自己的产品。在这个层次上,买家、卖家、平台之间存在三方博弈,而这三方显然有着三个不同的优化目标,因此需要对这三个不同的目标函数进行优化。卖家希望用最少的钱获得最好的效果;买家希望买到最好的东西;平台希望在交易过程中利益最大化。如何将三种不同诉求的目标统一在同一个建模中,是电商广告系统面临的又一大挑战。电子商务搜索不同于传统搜索。无论是在搜索领域、推荐领域还是广告领域,基本上都属于一个未知领域。这其中的核心在于两个任务。一是如何衡量和评估你所做的是否在优化你的业务。二是如何优化搜索、推荐和广告之间的关系。分享电商搜索的优化案例,优化GMV(搜索产生的利润),将搜索相关性与利润挂钩。什么是GMV?GMV是在搜索过程中可以衡量的预期利润。对于每一个商品关键词,用户都有一定的购买概率。这个概率乘以商品本身的价格,然后把所有的商品和所有的搜图相加,得到一个预期的利润,然后把这个利润最大化。目标是估计用户购买更昂贵的产品或允许商家赚取更多利润的产品的可能性有多大。带着这个目标,重新评估用户在电商搜索领域的决策行为,把这个决策行为简化为两个步骤。第一步是在搜索页面输入关键词后进行比较,比较后排序点击结果中的一个结果,并对点击结果进行建模。点击结果后,页面会跳转到下一页。进入第二页后,用户可以根据页面内容、商品价格等进行建模,判断是否需要购买该商品。简单来说,整个采购流程简化为两步,一是选择,二是决策;如何产生GMV也分为两步,第一步是从搜索页产生一个“点击”的决策动作,第二步是从商品页产生一个“购买”的决策动作。回到GMV公式中的购买概率,这个概率分为两部分,即点击概率和基于点击的购买概率。一旦拆分,这两个部分就可以分别建模。首先是点击建模。点击建模存在于搜索页面的基础上。当页面显示搜索结果时,点击开始。这部分有一个模型可以直接借鉴——LearningtoRank(学习排名)。两者唯一的区别在于,传统的Learningtorank是从用户的相关性,或者查询关键词的相关性中学习的。这里只需要将相关度从页面相关度标签转换为NDCG中的点击标签即可。下图是NDCG的公式。在这个公式中,未知数就是Fc,也就是需要建模来表达的未知数(点击概率)。点击概率由深度网络建模,这是该过程的第一步。第二步是二元决策,即用户到达某个商品页面时“是否购买”的决策行为。使用逻辑回归学习逻辑回归中的wp系数。与标准的二元决策不同的是,逻辑回归需要再次按价格进行加权。由此可见,价格是决定用户是否购买的重要因素,优化目标不再是相关性而是GMV。从下图的数据可以看出,用户的点击是受商品所在位置的影响的。前几个产品的点击率更高,这也和传统搜索类似。用户希望自己期待的产品能够排在比较靠前的位置,但这种基于位置递减的点击率远低于传统搜索。搜索。(注:以上内容根据Dataman洪良杰在DatamanOnlineLab录制的演讲整理。图片来自他现场PPT,本人审阅过。本文仅代表作者观点,不代表DT财经立场。)
