【.com原创文章】WOT2016大数据峰会将于2016年11月25-26日在北京JW万豪酒店举行。届时,数十位大数据领域的一线专家和数据技术先驱将齐聚现场,同时就机器学习、实时计算、系统架构、NoSQL技术实践,分享大数据领域的最新实践和最热门的行业应用。记者专访了即将在大会上发表演讲的一点资讯大数据平台研发总监田朝兴。让我们先睹为快,了解一下田超在一点资讯大型实时点击反馈平台的体验。田超,现任一点资讯大数据中心技术总监,负责基础设施和大数据平台相关工作。毕业于中国科学院计算技术研究所,获硕士学位,曾任雅虎北京研发中心工程师、同步磁盘CTO、高德科技高级技术经理。现任一点资讯大数据平台技术总监。大数据技术是处理海量数据的能力,以及建立在这种处理能力之上的数据应用。从Hadoop的大规模普及开始,业界具备了构建大规模数据存储和计算的能力。随着技术的不断发展,对上层应用具备实时处理海量数据能力的需求不断增加,由此衍生出诸如Storm等各种实时计算框架和系统。如今,包括Spark、GoogleDataflow等在内的一些技术,都希望将离线计算和在线计算更有机地统一起来。实时数据处理能力是现代互联网公司必备的组成部分。各公司的在线机器学习、实时用户画像系统、实时数据仓库、实时统计分析系统等业务,都需要具备实时大规模反馈数据的计算能力。这些系统的实时计算部分有一定的共性,也有一定的特殊性。一点资讯实时反馈平台在设计之初就对上述系统实时计算部分的通用计算模型和数据结构进行了抽象,并在系统设计时参考了谷歌的Mesa系统,因此至于将其设计成一个可扩展的平台,可以在一点咨询内部支持上述系统的实时计算部分。很多信息平台都是智能服务读者的,但是有一点信息是可以反过来的,服务读者的同时也为作者提供信息。系统根据用户的行为进行分析,挖掘用户的兴趣需求和需求被满足的情况。这些数据以及对数据的深度挖掘,为一点资讯的内容生态建设提供了全球上帝视角,让一点资讯可以从更高的角度观察群体表现和内容趋势。一点资讯还有一个叫一点洞察的系统,目前正在邀请测试中。系统将用户兴趣的知识映射到不同的领域,并以多种数据可视化方式展示这些知识。搜索引擎强调用户搜索,相当于用户引导内容;推荐意味着用户是完全被动的,不表达自己。他们首先给用户提供共同的内容,然后根据用户的点击行为猜测用户的偏好,然后将内容推荐给用户。搜索引擎和推荐引擎是结构相似的不同系统。将搜索技术和推荐技术有机融合是一点资讯兴趣引擎设计的核心目标。在兴趣引擎中,底层全连接用户的搜索和推荐行为数据,充分利用用户的主动表达和被动行为信号,基于人工智能技术不断学习和挖掘用户兴趣,基于内容分发用户利益。对于田超来说,大数据和人工智能之间的技术不断发展,其实是行业不断发展和提高数据处理和利用能力的自然过程。在最早的时候,行业中的大部分技术都是用来处理结果数据的。数据量在GB级别,存储使用Database。获取数据和存储计算的能力还处于起步阶段;随着Hadoop等一系列基础设施的不断发展,大数据技术也在不断发展。技术人员不仅要处理业务结果数据,还要对描述用户行为的日志进行更深入的处理,以辅助业务计算。在这个时代,数据量已经增长到PB级。存储使用各种分布式文件系统,现阶段各种离线计算、流计算、图计算模型也随着大数据应用的发展而发展起来;今天,我们已经有了更好的计算模型和更海量的数据收集后,对数据的利用也不断加深,人工智能和深度学习技术与大数据的结合也可以构建更多的智能应用。【原创稿件,合作网站转载请注明原作者及出处.com】由【WOT2016“大数据技术峰会”】主办的高端技术峰会将于11月25日在北京粤财JW万豪酒店盛大揭幕-26.40多位行业重量级嘉宾齐聚一堂,解析大数据技术与行业应用的实际结合,主办方将邀请更多讲师来到“WOT讲师访谈室”,深度解析技术干货。WOT2016更多访谈WOT2016向雷:打造属于你自己的可视化大数据查询平台WOT2016王安:看到金融与大数据的火花【WOT讲师】国家信息中心邵国安主任:大数据安全需求WOT讲师刘哲:听听AdMaster之Lambda架构实践WOT讲师赵强:Redis高性能缓存与持久化
