【.com原稿】WOT2016大数据峰会将于2016年11月25-26日在北京JW万豪酒店举行。数据领域的一线专家和数据技术先行者将齐聚现场,就机器学习、实时计算、系统架构、NoSQL技术实践等前沿技术话题进行深入交流和探讨。热门行业应用。郭文涛,2011年毕业于西安交通大学自动化专业。2011年7月加入百度丰巢算法团队,参与广告点击质量和用户行为建模相关工作。2014年加入京东广告部,负责京东展示广告的相关算法工作。主要负责广告触发、模型排序、推荐系统等相关工作。郭文涛是京东展示广告的负责人。他将在本次WOT大会上为大家做一场“深度学习在推荐系统中的应用”的主题演讲。请密切关注他!大会之前,我们采访了他,让我们听听专家们是怎么说深度学习的。1、作为国内知名的互联网平台,您认为京东广告面临的最大挑战是什么?你是怎么解决的?京东广告面临的最大挑战是数亿用户和数十亿产品。以及数据稀疏性的问题。在从传统模型转向DNN的过程中,我们面临着超大规模深度网络的问题。经过同事的不断探索,创新的LR+DNN模型很好的解决了这个问题,并于去年底推出了该模型。模型结构类似于谷歌公布的wise&deep结构,但更加灵活。和他们公布的时间相比,我们早了半年多。此外,与离散全连接网络相比,参数规模更小,更容易训练,模型更稳定。2、京东广告目前使用什么大数据软件或算法进行计算?效果如何?京东广告的广告产品非常丰富,各技术团队因业务场景不同,采用不同的算法和框架。实时用户画像采用kafka、storm、redis等方案实现数据秒级更新。ranking模型训练使用parameterserver、theano、tensorflow等工具实现自研深度网络。3、在海量计算方面,有什么经验可以分享给大家?海量数据肯定有金矿,但噪声所占比例更大。我觉得如何利用这些数据去挖掘有用的信息是比较重要的。简单来说,就是结合领域专家知识和机器学习算法,挖掘海量数据金矿。结合自己的使用场景,更精准的建模使用场景,利用海量数据实现数据驱动业务的闭环,可以实现质的提升。4.GPU是否用于大数据挖掘?我们在推荐系统的多个子模型和推荐算法中使用GPU。5、从互联网企业用户的角度,发表对开源技术的看法。在我看来,企业或业务线在不同的阶段应该采取不同的策略。一般来说,为了在前期快速搭建系统,我们应该尽可能采用社区完善的开源方案。当业务规模达到一定阶段(团队相对成熟)时,经常会遇到业绩不佳等问题。这时候就应该考虑在开源的基础上进行改造或者自研的方式了。6、您认为未来有哪些技术值得关注?请谈谈您对这些技术的看法。首先,肯定是深度学习的发展及其在各个领域的应用,比如:CNN和RNN图像识别,以及在NLP应用中发展出越来越有效的方法和技术。二是无监督学习领域。现在深度学习成功应用的领域,基本上都有大量的标注样本。例如在图像领域,imagenet有数以百万计的标注数据,在广告和推荐系统中的样本就更多了。在许多领域,不可能获得如此大量的标记样本,因此能够使用无监督学习从中学习有意义的表示非常重要。7.在产品开发和团队建设方面,您有哪些经验可以与我们分享?在互联网产品开发方面,互联网上很多高手的经验值得借鉴。作为研发的学生,你必须有产品思维来优化你的算法和架构。你需要经常使用你负责的产品,你需要作为用户体验产品,然后你需要根据这些体验的反馈来优化算法。在团队建设方面,我个人认为是尽可能让个人和团队目标的交集最大化,让个人和团队都能快速成长。对于纯算法团队来说尤其如此。【原创稿件,合作网站转载请注明原作者及出处.com】由【WOT2016“大数据技术峰会”】主办的高端技术峰会将于11月25日在北京粤财JW万豪酒店盛大揭幕-26.40多位行业重量级嘉宾齐聚一堂,解析大数据技术与行业应用的实际结合,主办方将邀请更多讲师来到“WOT讲师访谈室”,深度解析技术干货。更多访谈WOT2016【WOT】秘猿科技谢汉剑:区块链为信任体系带来新玩法WOT2016王安:看到金融与大数据的火花【WOT】闫世光:百度通过分布式集群实现万亿级计算WOT2016王晓峰:大数据助力物联网成为工业企业核心竞争力!【WOT讲师】国家信息中心邵国安主任呃:大数据安全需求
