消费者在电商网站上搜索喜欢的商品时,会在页面周围看到一些推荐。这些推荐的产品可能是消费者现在需要的,也可能是过去搜索过的。这种现象背后如果没有强大的技术支持,就无法在精准推送的同时保证消费者的体验。在举办的WOT2015互联网开发者大会上,京东推荐搜索事业部技术总监刘尚坤分享了《京东数据驱动下的个性化推荐系统》,记者也在会上对其进行了专访。接下来,让我们看看京东这个国内最大的自营B2C平台,是用什么技术为消费者做出精准、个性化的推荐?【受访者简介】刘尚坤·京东推荐搜索部技术总监刘尚坤,京东推荐搜索部技术总监,拥有七年B2C行业搜索经验。目前负责搜索引擎和推荐的产品开发和团队管理。他带领团队将推荐搜索技术应用于京东各品牌的支持,包括移动平台、PC平台,以及微信平台的所有推荐业务和场景。个性化推荐简介个性化推荐是通过全方位的数据准确描述用户的购买意愿,然后有针对性地向用户推荐购买意愿高的产品,为用户提供极致的产品体验,提高订单转化率,增强用户粘性。个性化推荐模型分为两类:召回和排序。在采访中,刘尚昆通过实例对这两类模型进行了详细的讲解。召回模型召回模型是选举推荐的候选人。京东主要采用基于行为的召回模型,分为短期和长期两种。其他的是基于偏好和区域的。基于最近行为的基于行为的召回模型:例如,如果用户最近喜欢浏览一些炒股书籍,那么会向用户推荐他可能感兴趣的其他一些炒股书籍。特别是最近的行为,这种情况称为最近行为的相似产品推荐。例如,如果用户购买了《秘密花园》的副本,则会立即向用户推荐彩笔。这种情况称为近期行为的商品购买搭配推荐。刘尚昆说:“基于近期行为的线上算法最基础,最好用,转化率最高。”长尾产品的搭配是基于中长期行为的召回模型:中长期行为通常是半年左右,可以使用相似的浏览、线下购买和搭配和离线SVD。做匹配的时候会有一些小技巧。因为京东的产品种类繁多,有些产品是没有用户行为的。针对这样的情况,使用购物篮分析来建立产品与产品之间的关系。将这些关系应用到个性化推荐中,以增加长尾产品的匹配覆盖率。preference-based是用户画像:比如一个女生比较喜欢化妆品和衣服,那么会根据她的兴趣爱好,根据她过去在京东的行为进行推荐。当然,在推荐的时候,还要考虑用户的购买力、敏??感度等问题。如果用户特别喜欢户外产品,这就是用户的偏好。像韩服,这是用户的美容偏好。当你不知道用户喜欢什么产品,或者有什么爱好甚至喜好时,会通过一些算法来预测你感兴趣的产品。基于大数据,从大量的其他用户中挖掘出最接近的用户看他喜欢什么样的东西,他的兴趣是什么,他的品牌是什么,然后传递给用户。基于地域:京东有很多配送点,部分地区可以建模。比如三里屯地区买扑克牌和骰子的人比较多,因为有些人需要用它们来给女孩子做魔术。在其他一些地区,也可能会有这样的对某种消费品的偏爱。通过区域划分可以得到很多信息,比如购买力。与万国城和石各庄相比,万国城的消费水平相对较高,所以推荐一些高价位的产品。区域模型也可以用于没有任何消费行为的新用户。拿一个没在京东买过商品的同学来说。如果他在清华地区,他会推荐一些难的考研题,或四六年级的书。如果你是北京联合大学的学生,那就比较简单了。排序模型当积累了一定的用户和流量,有一定的点击和购买,就需要一个排序算法。排序学习标记:Point,pair,wise。第一步是做模型选择,因为模型有不同的特性和特性需要选择。二是根据所选型号进行标注。如果是Pointlabeling,就是选择positive和negativeexamples。如果是pairwise,标注方式是,比如有ABCD四个商品,A没有操作,B点击,C购买,D没有任何操作,然后BA被点击,那么BA就是正例。CA是正例,因为是实际购买,CB是正例,因为C是购买,B是点击。购买比点击更重要。CB也是正例,CD也是正例。后面的道更重要。特征计算:召回模型标签特征,在线相似度,在线相关度,离线相似度,离线相关度,基于用户画像的召回和基于区域的召回,从哪个模型召回,这是我们的重要内容。商业模式,比如某个商品是大品牌还是小品牌等。用户特征其实就是用户画像的维度,用户的性别和购买力,以及用户点击的商品和他们购买的商品之前购买的。商品特征、销量、价格区间等,Context特征是指用户前后的一系列操作。时间特征,产品被点击购买等区域特征,季节特征等离线计算和在线计算离线计算,数据存储在DataMart,MapReduce运行在Hadoop上,大量的MahoutSpark通过分布式任务调度系统将下发结果存储在HBase中。在线计算计算流程,通过Kafka接收消息存储在HBase中,在线计算主要基于Storm,实时消息基于Kafka处理,150亿+消息。未来的突破点当被问及未来从哪个角度突破个性化推荐系统时,刘尚昆说:“个性化推荐肯定会达到一定的瓶颈,我不敢说在机器学习和推荐搜索算法方面,它已经达到了一个什么样的高度呢?因为我们面前有很多巨头,包括国外,一些新技术也在不断的出现,经过几年的发展,京东的推荐部也在不断的完善。科学家加盟,过去京东关更关注推荐系统如何带动京东的销量,如何帮助网站提高转化率,未来应该更多考虑体验指标,即如何提升用户体验”个性化推荐助力618大促谈到今年的618大促,刘S航坤表示:“过去,618是对京东系统的测试或压力测试。但现在随着京东系统技术的成熟,从2014年开始,618更像是一个聚会。您可以结识新朋友并从中学习知识。在个性化推荐方面,今年专门为618设置了一个场景,并优化完善,达到数千人。”写在最后:一路走来,京东个性化推荐突飞猛进。未来,我们会从用户体验出发,研发出一些让人惊喜或者吸引人的产品。采访最后,刘尚昆表示,“京东计划在下半年利用大数据技术,在用户不下单的情况下,直接将产品送到用户手中。当然,用户也可以拒绝接受它。这将首先在小范围内实施。”您可以想象一下,您需要的商品无需下单即可送货上门。当时是什么情况?
