HadoopSummit即将到来,业界最杰出的精英人才将在这里共同探讨Hadoop和大数据的未来。云集全球主要技术力量的圣何塞Hadoop峰会即将召开,其中的热点话题之一就是解答Hadoop未来的发展方向。Hortonworks创始人兼架构师SanjayRadia将主持与该主题相关的13场讨论。面对这些讨论将如何展开的问题,Sanjay回应道:“Hadoop仍在以非常高的速度推动创新,目前正在构建下一代Hadoop。这条发展路径承载了一系列Hadoop核心创新和相关技术.参与者将了解包括HDFS和YARN在内的几个重点项目的开发过程,以及以Hadoop平台为核心的各种孵化器项目和行业倡议。Hadoop生态系统即将发布的发展路线图、关键功能和先进技术研究成果。”我还问,如果时间有限,我必须选择3个讨论活动参加,我应该如何选择?.他的建议是:ApacheHive2.0SQLSpeedUpSpeaker:AlanGates,HortonworksApacheHive是Hadoop领域最常用的SQL接口,它最活跃的阶段是数据仓库应用。为了满足客户的仓储需求,我们需要将其规模扩展到PB级别,提供用户需要的SQL,根据交互时间来执行任务。Hive社区正在努力构建Hive2.0版本,其中包含一系列重要的新功能和性能改进。具体来说:添加LLAP,一个用于亚秒级响应时间的守护进程层。添加HBase作为Hive元数据存储选项以加速元数据访问并减少查询计划时间。提高Hive从条件输入内容中获取数据的能力,包括ApacheFlume和ApacheStorm。SQLMERGE命令的添加旨在改进和扩展Hive以事务一致的方式管理更改数据的能力。通过部署ApacheCalcite帮助Hive获得使用多种存储引擎(如HBase)的能力。本次对话活动将涵盖相关用例,功能构建中的架构调整,分享Hive的实际提速效果,以供参考。ColorfulYARN:应用程序和一流的服务支持演讲者:VinodKumarVavilapalli,HortonworksApacheHadoopYARN是一个现代资源管理平台,用于批处理(MapReduce)、交互(Hive、Tez、Spark)和实时处理(Storm)和其他工作负载管理多组数据处理引擎。这些应用可以同时存在于YARN中,共享一个数据中心,以低成本解决资源管理、隔离、多租户等实际问题。在本次演讲中,我们将探索一种新的用例组合——服务——作为YARN社区的下一步。YARN作为一种技术解决方案,一直坚定地支撑着各种应用和服务。即便如此,为YARN提供对现有服务和新服务的支持开辟了一条新的前进道路。为了有效简化这些服务并取得优异的效果,我们将交流如何针对各种平台调整ApacheHadoopYARN以支持相关服务并实现开箱即用。企业客户希望尽可能少地关注基础设施,更多地关注端到端的用户实例。鉴于此,我们还将讨论API、工具集和多彩的YARN如何为开发者社区带来强大的收益。将HDFS演化为通用分布式存储子系统演讲者:SanjayRadia和JitendraPandey,Hortonworks,Inc.我们正在将HDFS演化为分布式存储系统,不仅支持分布式文件系统,还支持其他存储服务。我们计划将Datanodes的容错块存储层升级为通用子系统,并在此基础上构建包括HDFS、对象存储在内的其他存储服务。我们还引入了一个存储容器抽象,它被复制以保证可靠性。前两种容器类型是块容器和对象容器。块容器是HDFS块的复制集合,可通过低块报告开销实现可扩展性,同时允许相关文件位于同一位置。对象容器一般包含大量的小对象,主要用于对象存储服务(如S3)。我们还计划通过LSM-tress等结构化存储容器为HBase提供出色的支持。我们的解决方案具有多种优势,使Datanode的物理存储能够在不同的存储服务之间共享,而不会产生碎片化后果。存储容器还隔离了实现和客户端协议,允许每种容器类型独立发展。未来我们还将在容器解决方案中引入复制、位置服务、退役等全局容器和存储管理功能。原标题:ApacheHadoop的未来
