我们目前正处于21世纪第二个十年的中期。五年前大数据炒作开始时,人们普遍认为Hadoop将成为未来无处不在的解决方案。然而,随着Hadoop市场的不断发展,事实证明这种预期未必准确。从Hadoop市场的应用和创新来看,这种铺天盖地的宣传在一定程度上已经逐渐平息。鉴于大家对Hadoop的重要性保持着高度认可,我们是否有必要继续鼓吹Hadoop将成为大数据行业的“下一波浪潮”?Hadoop是否已经过了它的历史性转折点?——成熟的速度是不是有点太快了?当某个业务领域在各方面都出现成熟迹象时,市场的发展趋势很快就会趋于平衡。而Hadoop的“下一波浪潮”很可能会止步于当前水平,这意味着它在大数据分析市场的份额将停滞不前(而整体市场规模将继续增长)。要确认Hadoop是否已经到了这个拐点,首先需要回顾一下它过去的发展历程和未来的演进前景。创业活动是市场增长的明确指标,而该指标的下降是市场成熟的强烈信号。在这十年的初期,一场规模不小的创业风暴席卷而来,但从目前的情况来看,Hadoop平台、工具和应用厂商已经在市场上找到了相对稳定的地位。例如,根据InformationWeek最新的市场研究报告,每个供应商都已进入市场三到四年——那时我自己还是一名年轻的ForresterHadoop分析师。这是市场正在成熟的显着迹象之一。Hadoop成熟的另一个标志是主要的需求驱动因素已不再随时间持续变化,这意味着它的利基始终针对相同的客户需求。不出所料,这份调查报告再次喋喋不休地通过调查数字证明用户主要使用Hadoop进行非结构化数据分析、客户预测分析和情感分析。目前的情况似乎与我在2011年对新兴的Hadoop市场的研究没有什么不同。一个技术品类走向成熟的另一个重要标志是,相关行业多年来一直在重复同一个发展方向,比如通过一套解决方案寻找最具吸引力的增值功能增长点。例如,大数据博客仍在争论一个实际上已经得到解答的问题:SQL能否在Hadoop生态系统中生存。答案无疑是肯定的,因为调查中列出的各个供应商提供的SQL访问/分析选项的替代方案充分证明了这一点。与“千篇一律”类似,目前Hadoop技术的市场定位还比较模糊。正如我去年四月在我的Dataversity专栏中指出的那样,Hadoop技术仍然没有明确的界限(与NoSQL和其他大数据解决方案相比),这是我三年前在Forrester工作时多次提到的。今天,Hadoop行业的“身份危机”很大程度上源于它仍然缺乏一套通用的标准,始终无法给出一个清晰统一的Hadoop将会和能够实现的发展前景。如果你仔细看看Apache软件基金会目前对Hadoop的定义,你会发现该项目仍然属于一个包罗万象的而非一个清晰的架构概念。例如,最近加入Hadoop的Spark似乎仍然过于随意,并且与Cassandra仍有一些联系。业内没有人真正将Spark视为Hadoop的竞争对手,而不是一个组件。相比之下,Cassandra仍然不是最热门的一套开源、实时、大数据社区,其持续增长的势头似乎已经开始明显下滑。同时,当越来越多关于某个技术体系的讨论集中在其在主流用户中所占比例微不足道的时候,就意味着其目标市场已经难以打开跨越式的局面。而这也正是这份调查报告的研究结论和主要思想:《信息周刊》数据显示,火车还没有真正离站:只有4%的企业客户广泛采用了Hadoop项目,而18%的企业客户指出ThatAdoptionofHadoopprojectsonlytoalimitedextent...这两个结果都高于去年调查报告中使用的3%和采用的12%。另有20%的企业客户有使用Hadoop技术的计划,但58%的受访企业表示尚未考虑将Hadoop引入其业务环境。如果你有几年分析行业的经验,你会发现这种情况有些眼熟。二十多年前,商业智能市场曾经作为一个独立的业务拥有自己的地位,但它在主流知识工作者中的采用率一直很低。或许商业智能——或者Hadoop甚至其他大数据技术项目——注定不会像智能手机那样被市场广泛接受。但这并不意味着Hadoop无法在其定义明确的利基市场中成长为重要且庞大的业务类型。毕竟,只要时间充裕,即使人到中年,Hadoop依然可以在花白之前赢得应有的财富和名望。原标题:Hadoop可能已经成熟了
