或者商场里的衣服很多,但你喜欢的不多或者干脆选择网购,盯着屏幕看眼花缭乱,合心意的衣服不多,效果不明……怎么办?有没有办法快速买到合适的衣服?最好的方法是什么?我们生活在一个日益发达的互联网世界中,很多问题都可以从计算机上、从互联网上、从大量的数据信息中得到解答。美国公司StitchFix,实现了数据科学和造型师的结合,为用户挑选产品,送货上门免费试用。那么,StitchFix是如何准确快速地为用户推荐产品的呢?WOT2016移动互联网技术峰会上,StitchFix数据科学总监/前Twitter美国总部技术总监王建强发表了精彩演讲,介绍了美国的下一代购物。领跑者stitchfix的商业模式,颠覆了传统服装零售行业固有的实体店运营模式,消除了用户在购物时往往最头疼的“选择困难症”环节。【讲师简介】StitchFix数据科学总监/前Twitter美国总部技术总监王建强王建强,中国科学技术大学管理学学士,博士。2008年获得爱荷华州立大学统计学博士学位。曾任科罗拉多州立大学统计系客座教授,美国国家统计科学研究所与美国农业部联合培养博士后,美国农业部资深科学家惠普实验室。广告组数据科学家。目前是stitchfix的数据科学总监。多年数据分析建模经验,涉及领域包括需求预测、供应链管理、广告点击率预测、广告排名、推荐算法、统计预测模型等。对数据科学教育、互联网广告和新兴零售模式感兴趣。通过StitchFix的商业模式看下一代购物2010年10月,KatrinaLake创立了StitchFix。StitchFix是一家在线个性化服装推荐公司。它目前拥有数千名业余造型师。他们一般都有丰富的时尚行业经验,为用户量身定做衣服。目前,StitchFix的产品主要是服装。除了服装和配饰,它最近还增加了女鞋、孕妇装和超小码。未来,StitchFix还将加入男装。StitchFix的工作模式是什么?作为新客户,您在注册时需要填写您的个??人信息,主要包括:体型、购买衣服的颜色偏好、喜欢的衣服类型、可以承受的衣服价格。基于这些素材,StitchFix通过推荐算法和造型师的结合,帮助用户挑选出五件衣服,并将衣服送到用户家中。用户可以试穿并决定购买哪些衣服,哪些衣服免费退货。StitchFix的主要客户是没有时间购物的用户、喜欢新款式衣服的用户和追求时尚的人群。这里有两大创新:一是通过推荐电商,购物时无需自己浏览、挑选衣服。你只需要填写个人资料,StitchFix就可以自动为你选择衣服。其次,StitchFix在提供服务时,将数据科学或推荐算法与造型师相结合。StitchFix的四大服务方式StitchFix目前提供四大服务方式:订阅服务、及时请求服务、基于造型师和用户关系的服务、延时服务。最常见的服务方式有订阅服务和及时请求服务。用户选择订阅服务后,用户每月或每季度可领取一箱衣服;如果选择及时请求服务,则需要先注册个人信息,需要时再发送请求。此外,StitchFix还提供基于关系的服务和延迟服务。StitchFix主要致力于基于造型师和用户之间的关系提供服务。通过在用户和造型师之间建立依赖关系,更新对用户的理解,增加用户粘性。延迟送达是指接到用户请求后,经过造型师推荐、库房管理、订单发货等环节,衣服会在7-10天左右送达用户手中。用户在使用期间需缴纳20元的造型费。如果不买衣服,还要交20元的造型费。如果购买一件以上的衣服,20元的造型费可以计入衣服中。此外,如果他们购买五件衣服,所有衣服都可以享受25%的折扣。如何通过数据科学和造型师的结合,为用户选择衣服?第一步:根据用户提供的信息进行第一轮筛选,剔除用户不喜欢的颜色和款式。最后,大约有5000件衣服可以满足每个用户的需求。-7000件。第二步:根据算法筛选推荐,选出匹配度高的一批衣服,大概50-100件。第三步:将第二步选好的衣服交给造型师,由造型师进行精细筛选。这里我们先关注算法推荐。算法推荐的本质是计算用户与衣服的匹配度的过程。通过用户数据和物品数据计算每个用户和每个物品的匹配度。用户数据:主要包括结??构化数据和非结构化数据。结构化数据是指静态用户数据和用户行为数据,非结构化数据是指用户填写请求、商品评论等信息。商品数据:对于衣服,主要是进行特征分类。共同特征主要包括三类,即:衣服的颜色、衣服的图案、衣服的材质。其他特征包括:是否有口袋、口袋位置、真口袋/假口袋等。有了用户数据和商品数据,通过推荐系统实现推荐商品的功能。这里常见的算法包括:逻辑回归、弹性网络、协同过滤、因子分解机、LDA(LatentDirichletAllocation)、NLP和计算机视觉等。那么,如何计算用户与衣服的匹配度呢?因为用户数据中包含了用户请求等非结构化数据,所以对这些数据的处理离不开人,因为在这方面人远比机器强。为此,StitchFix设计了人机交互系统。在这个系统中,推荐是通过推荐算法和造型师相结合进行的,算法具有比较强的计算能力。有一个用户风格彩虹和一个产品风格彩虹。比如计算这两条彩虹的前置距离,普通人很难在短时间内算出这两条彩虹的前置距离,而计算机却可以轻松做到。另外,在推荐的时候,造型师一般会看之前给用户推荐过哪些衣服,尽量避免和之前的衣服相似的衣服。所以这个时候可以用电脑筛选出一些和以前推荐的很相似的衣服。此外,算法还可以在大规模数据中发现模式。比如对于某个年龄段、某个收入阶层的用户,他们一般喜欢什么样的风格,虽然造型师可能有一些直觉,但他的直觉不一定有数据支持。所以有了数据和算法之后,他的一些直觉错误就可以得到纠正。这些经验丰富的造型师会根据直觉提出建议。比如当他看到一个住在明尼苏达州的30岁的用户,他的体型是多少,他的脑袋里就会出现一个图片,他马上就能想到库存里的一些衣服,说不定会和这个用户匹配。这方面其实是个人的一些直觉。用一些简单的模型很难建模。此外,造型师还可以与用户建立私人关系,增加用户粘性。注:本文由王建强整理于2016年8月,在WOT2016移动互联网技术峰会主会场《Stitch Fix -- 数据科学+造型师颠覆传统服装零售业购物方式》主题演讲。WOT2016大数据峰会将于2016年11月25-26日在北京JW万豪酒店举行。届时,数十位大数据领域的一线专家和数据技术先驱将齐聚现场,聚焦机器在学习、实时计算、系统架构、NoSQL技术实践等前沿技术话题进行深入交流和探讨的同时,分享大数据领域的最新实践和最热门的行业应用。更多WOT2016大数据技术峰会信息,请访问大会官网:http://wot.51cto.com/2016bigdata/
