基于深度学习的系统可以为数十亿在线消费者提高推荐内容的相关性。 过去十年,全球电子商务价值飙升至数万亿美元,服务于数十亿消费者。由推荐系统引擎驱动的个性化推动了在线销售的这种爆炸性增长。 推荐系统可以让购物更加个性化。在电子商务网站上搜索产品时,他们会捕获搜索结果,或者只是显示建议。使这种令人愉快的体验在Internet上可用的原因是规模越来越大的数据集和模型。 NVIDIAMerlin是推荐系统的助推器。它加速训练和推理,使各类企业能够更好地利用数据来构建由NVIDIAGPU加速的推荐系统。 在线交易比以往任何时候都更具风险。根据eMarketer发布的数据,2021年全球在线销售额预计将达到近5万亿美元,较上年增长近17%。 在一些世界上最大的在线网站上,即使推荐内容的相关性增加1%也可以增加数十亿的销售额。 投资推荐系统已经成为当今互联网巨头的主要竞争优势之一。 根据MordorIntelligence公布的数据,到2026年,整体推荐系统市场将从2020年的仅21.2亿美元增长至151.3亿美元。并且该研究公司还表示,在推荐系统引擎的细分市场中,规模更大、增长更快的市场在亚太地区。 然而,行业面临的挑战是增加相关性需要更多的数据和更多的处理能力。这些数据包括数十亿种产品和消费者档案中的数万亿次用户和产品交互(点击、查看)。 这种规模的数据可能需要几天才能完成模型训练。然而,越早推出基于更多数据的新模型,它就越相关。 Merlin的模型、方法和库集合包括用于构建基于深度学习的系统的工具,这些系统能够处理数TB的数据,以提供更准确的预测并增加命中率。 SNAP借助Merlin和GPU提升Inference 根据eMarketer发布的数据,预计2021年美国数字广告收入将达到1911亿美元,同比增长25.5%。 Snap是社交媒体应用程序Snapchat的母公司,总部位于加利福尼亚州圣莫尼卡,每日活跃用户超过3亿。该公司通过社交照片和视频消息服务产生广告收入。 SnapCEOEvanSpiegel在其第三季度损益表中表示:“我们将继续专注于为我们的广告合作伙伴带来强劲的业绩,通过创新来扩展平台的功能并更好地服务于社区。” Snap的技术障碍是试图继续为其工作负载开发高成本排名模型,并在降低成本的同时扩展到更复杂的模型。 这家公司使用NVIDIAGPU和Merlin来提高其内容排名能力。 Snap工程副总裁NimaKhajehnouri表示:“Snap使用NVIDIAGPU和Merlin软件,将机器学习推理的成本效益提高了50%,并将服务延迟降低了2倍,可以提供更重载和更准确的服务用于实验和部署的数据。广告和内容排名模型,提供更多的计算空间。” 腾讯使用MerlinHugeCTR推广模型训练服务——微信,以及支付平台——微信支付。 其工程师需要快速迭代广告推荐系统的模型,这将增加对训练性能的需求。 腾讯专家工程师孔祥庭表示:“广告业务是腾讯内部比较重要的业务之一,通过推荐系统提升整体广告收入。”问题是广告推荐的准确率只能通过训练更多的样本数据(包括更多的样本特征)来提高,但这会延长训练时间,从而影响模型更新频率。 他还表示:“HugeCTR作为推荐系统的训练框架,已经融入到广告推荐训练系统中,使得模型训练的更新频率更快,通过训练更多的样本来提升在线广告效果。” 他补充说,在模型的训练性能提升后,我们可以训练更多的数据,提高模型的准确率,从而增加广告收入。 Meituan借助NVIDIAA100GPU降低成本 Meituan的业务涵盖200个服务类别,并在食品、娱乐和点播服务方面高度交织。这家中国互联网巨头拥有超过6.67亿活跃用户和830万活跃商家。 美团资深技术专家黄军表示,如果他的团队想要大幅提升性能,通常更倾向于训练更多的样本和更复杂的模型。黄军还表示,美团的问题在于,随着模型越来越复杂,训练框架深度优化会变得困难。他表示:“我们正致力于将NVIDIAHugeCTR集成到基于A100GPU的训练系统中,成本将大大降低。这只是初步的优化结果,未来还有很大的优化空间。”“ 美使命最近报告称,在2021年第二季度的过去12个月中,每个交易用户的平均交易量增加到32.8笔交易,而在2020年第二季度的过去12个月中为25.7笔交易。
