8月4日,由O'Reilly和Cloudera联合主办的全球最大的大数据大会Strata+HadoopWorld在北京举行。Strata+HadoopWorld(SHW)是全球最大的大数据盛会,提供各种技术深入交流的机会,参会者可以看到最前沿的技术、最广泛的应用场景、最有趣的Usecase教学,以及最全面的大数据行业及趋势探讨。 作为致力于汇聚大数据领域最具影响力的产业决策者、战略家、架构师、开发者和分析师的国际会议,从硅谷进入中国,旨在汇聚最前沿的碰撞科学和新兴商业基金会将共同创造工业和技术的未来。 SHW的演讲不仅囊括了全球大数据领域的顶尖技术专家,还介绍了金融、多媒体、零售、物流等各个大数据应用场景的经验。 我们目前生活已经完全进入了信息时代,大家可能都间接使用过DougCutting的作品。他是Lucene、Nutch、Hadoop等项目的发起人。是他,将高深莫测的搜索技术的产物,贡献给了普通用户。同时,他还创立了目前在云计算和大数据领域风生水起的Hadoop。DougCutting目前是Cloudera的高级架构师,最近在Hadoop在中国的推广上有了新的进展。 清华大学数据科学研究所最近宣布与数据管理和分析平台Cloudera建立合作伙伴关系。在ClouderaCAP学术合作项目的支持下,清华大学与Cloudera将共同发布BASE(BigAnalyticsSkillEnablement)计划,以期解决中国大数据行业的人才短缺问题。 合作项目仪式结束后,笔者有幸采访到了传奇人物DougCutting。接下来,让我们听听创始人是如何解读Hadoop的。 Hadoop越来越重视安全性 Hadoop已经成为开源的代名词之一,其应用范围也非常广泛,但安全性一直备受争议。按照Doug的说法:其实十年前Hadoop创立的时候,并没有做安全,但是我们不断加强安全模块的研发,现在Hadoop已经成为一个非常安全的平台。 首先,Hadoop增强了登录的安全性,确保登录的人拥有合法的身份验证。此外,还有文件级别的安全保护。可以实现某列或某表只有部分人可以登录,通过认证的人可以看到,其他没有权限的人看不到。所以这种权限管理和登录认证管理,还有文件保护管理都做得很好。 在动态保护方面,数据在网络上传输时也会进行数据加密,通过数据加密保护传输中的数据不被泄露或存在安全漏洞。而且,Cloudera也在不断开发新技术,Hadoop平台上加入的新部件层出不穷。 与高校合作,推动开源发展,培养更多人才 Cloudera在高校合作方面也取得了成果。据道格介绍:我们也在和海外很多大学合作。这些合作的名单很长,包括美国的大学,包括新加坡的大学,亚洲其他国家的大学,以及欧洲的一些大学和研究机构。 合作的主要形式是提供免费课程。Cloudera多年开发全套免费课程,免费提供给此类高校合作。Cloudera在中国选择的第一个合作伙伴是清华大学,未来还将与更多中国高校展开合作。 DougCutting亲口证实国内公司为开源做出了很多贡献 最近笔者听了很多国内知名公司技术人员的演讲,其中大部分都提到了对开源社区的代码贡献.但实际情况如何呢?道格他妈的不能问这个问题。 Doug表示:中国企业确实为整个Hadoop开源社区做出了很多贡献,比如华为。华为参与Hadoop开发多年,贡献良多。阿里巴巴和腾讯,包括中国的一些大型互联网公司,都是Hadoop的用户和Hadoop技术的贡献者。中国企业确实功不可没。 Hadoop的开发包括两个层次,一个是Hadoop项目本身,另一个是围绕Hadoop中心的很多其他组件的开发。比如Linux,不仅仅提到了内核,除了Linux内核之外,Linux上运行的应用软件还有很多,Hadoop也是如此。目前,90%的Hadoop软件运行在Hadoop系统平台上,这些软件来自于Hadoop平台之外的开发。例如,在美国开发的一些软件是整个Hadoop生态系统的一部分。我相信虽然越来越多的开发者不是直接来自于Hadoop,但是Cloudera会在整个生态系统环境中打造一个非常丰富的生态系统,让更多的参与者能够开发。 Cloudera模式的成功也是基于Cloudera自身的特点,但并不适合其他开源厂商。DougCutting***说:每个公司都应该探索最适合自己的道路和商业模式。我们也拭目以待,看看未来十年会出现什么样的商业模式。
