【.com原稿】2017年12月01-02日,由深圳中州万豪酒店主办的WOTD全球软件开发技术峰会在隆重举行。本次峰会以软件开发为主题,数十位专家嘉宾将带来众多精彩纷呈的技术内容分享环节。12月1日下午,Hortonworks高级技术成员、HBase核心贡献者TedYu发表了题为《The New Hbase brings new era》(InnovativeHbase***NewEra)的精彩演讲。会后,记者采访了他,请他分享技术心得。Hortonworks核心成员TedYu接受采访。2011年,雅虎剥离了Hadoop业务。以雅虎为首的Hadoop开发副总裁带领20多名核心成员成立了Hortonworks。作为Hortonworks的核心成员之一,TedYu已经连续七年参加WOT技术峰会。他一直在美国工作,一直坚持用英文准备PPT演讲稿。用他的话说,他始终相信中国技术人员的能力。演讲内容技术含量高,涉及大量技术词汇。担心输入中文时翻译不准确造成的歧义。所以他用英文写,请大家看看是什么意思,比如技术词汇,用在HBase或者其他地方一般不会有歧义。谈到Hbase的核心,TedYu说HBase是基于谷歌的Hadoop。Hadoop的DataNode公布后,谷歌上出现了很多Bigtable产品。HBase的核心本来就是NameNode。在这个核心之上,还有不同的开发者,构建Apache,或这些相关项目。因为这个内核本来是不支持SQL查询的,有了这些其他的项目,用户也可以用SQL查询,就方便多了。说到HBase的优缺点,我们知道HBase最早是Hadoop的一个子项目,后来成为了鼎力的一个项目。也就是说,如果客户的集成中已经有HBase,那么使用HBase作为NoSQL存储是很自然的选择。反之,比如用户使用Kafka,Kafka根本就没有使用HBase,那么如果属于其他存储系统,HBase可能就有些牵强了。TedYu还着重分析了Hbase的劣势和解决方案。他说,如果HBase本身不支持SQL,但是在这种情况下,对于大多数应用来说是非常不方便的,因为比如SQR有很多复杂的查询,如果用户需要使用HBase的底层API来完成这些复杂的操作,会很费时间,首先就是不方便携带,因为改SQL很方便,而且可以一次性改完。如果使用API??,会影响开发进度。但是优点是其他项目弥补了HBase的不足。随着Hbase在国内的接受度越来越高,TedYu感慨万千。他非常看好中国大数据和人工智能技术的发展前景。中国人口众多,应用场景非常多样,会产生大量的数据。在这方面,我认为数据产生的规模已经超过了像美国雅虎这样的公司处理的数据。他认为,中国的大数据应用有其独特性,会带动相关方面取得长足进步。接下来,在谈到Hortonworks重要产品HDP和HDF的免费开源话题时,TedYu解释道:“所有的开源都是符合中国国情的。众所周知,去IOE已经提了很多年了。我觉得三个IOE,我没有详细关注,但是至少我知道IBM的情况不是很好,因为好像除了上个季度,它的营业额在很多季度都有下降,就是在大公司很少见。这也是一个解释对于中国这么大的国家,大数据非常多,其中有一些是敏感数据,需要自己存储和管理。这需要很强的透明度,所以我认为这两个是完全开源的。从概念上讲,它们符合中国政府要求的公开透明。”在接受***采访时,TedYu告诉我们,开源之后,国内的开发者和用户可以对Hortonworks的产品有更深入的了解。这样一来,在这些项目中,也会有回报,所以应该是双赢的。【原创稿件,合作网站转载请注明原作者和出处为.com】
