根据***调查结果,现代数据技术虽然依然保持快速发展的势头,但75%的企业数据仍然是结构化的。当今世界仍以关系型数据库(简称RDBMS)为主导,但以Hadoop、NoSQL为代表的新技术解决方案开始迅速崛起,并开始在结构化数据领域留下自己的足迹和影响。这是由DellSoftware赞助的Unisphere调查确定的一个关键转变,该调查表明75%的企业数据仍然牢牢锁定在关系数据库中——对于大多数企业来说,是Oracle数据库和MicrosoftSQLServer。更令人惊讶的是,不到三分之一的组织正在积极管理非结构化数据。现在不是大数据时代吗?这些公司还活在什么时代?有趣的是,虽然调查报告显示NoSQL和Hadoop的采用和实施显着增加,但最大的发现是,真正了解如何管理企业关键数据的仍然是保守的数据库管理员。成员。从结构化解决方案到结构化数据关系数据库可以说是人类科技发展史上的一次伟大创新。早期的数据库解决方案(如IMS)迫使开发人员提前思考查询机制设计和架构实现思路,这往往会在数据需要更改时对灵活性造成巨大限制。然而,用于关系数据库的SQL(结构化查询语言)将查询设计与模式设计解耦,使开发人员可以更加自信地专注于模式设计,从而实现未来按需使用。数据查询。这种戏剧性的转变大大提高了数据库解决方案的可访问性,使它们更加强大。然而,随着非结构化或半结构化数据的不断涌现,原本安逸舒适的关系型数据库领域开始面临一波又一波的压力和挑战。大部分这种新型数据是由GeoffreyMoore所描述的所谓参与系统生成的,并且在过去几十年中甚至开始出现在记录系统(例如ERP和CRM系统)中。总而言之,当数据本身在变化、速度、体量等方面具有可预测性时,关系型数据库仍然发挥着不可替代的关键作用。但我们的大数据世界永远不会忠实地遵循以下预测的轨迹。即便如此,未来还有很长的路要走。鉴于此,Unisphere调查的受访者继续将主要关注点放在结构化数据上也就不足为奇了:83%的组织认为交易数据(包括电子商务)持续增长将是结构化数据量增长的最大来源组织内的结构化数据,而51%的受访者看到管理数据(例如ERP系统)的增长。·虽然现在越来越多的行业将社交数据的激增提上议事日程,但内部文档的创建仍然被视为非结构化数据总量增长的头号驱动力,获得了超过50%的增长访客的认可。尽管这类数据具有关系数据库友好的特性,但也值得指出的是,它对NoSQL和Hadoop的依赖也在增加:所有使用MongoDB的受访者中约有70%正在运行的数据库数量超过100个,其中30%运营着500多个数据库,这些受访者中近60%就职于员工人数超过5000人的大型企业。·目前正在使用Hadoop的受访者中,约有70%的人运行着超过100个数据库,45%的人运行着超过500个数据库,而这些受访者中约有三分之二就职于员工人数超过1000人的公司。如果非关系数据技术解决方案做得很好,为什么它们的采用仍不如预期?答案(也许)是数据库管理员应该被追究责任。#p#为什么人气不尽如人意?正如报告所指出的,在其企业中同时采用Hadoop和NoSQL的受访者中,约有72%要求数据库管理员负责管理非关系型技术解决方案。事实上,这部分数据库管理员占受访者比例的48%;IT业务主管占另外20%。在采用领先技术的需求方面,这些角色通常是滞后的,而不是领先的。DBA整个职业生涯的这一部分都是围绕Oracle数据库或MicrosoftSQLServer构建的,因此他们固守自己所知道的东西是可以理解的。调查报告还发现,只有约10%的受访者采用过NoSQL数据库(超过一半的受访者表示未来三年内没有采用相关解决方案的计划),使用Hadoop的受访者比例为只有20%(57%的受访者表示未来三年没有采用相关解决方案的计划)。由此可以得出结论,如果我们以这群人为主要力量来推动更多的现代数据技术,那么得到的意见和结论一定是比较负面的。事实上,最令人惊讶的是同时运行NoSQL和Hadoop解决方案的受访者的负面回应。换个角度来看,我们意料之中的是,这样的受访者其实发挥和选择的余地不大。为了达到当今企业所需的规模和灵活性水平,现代数据技术的重要性变得越来越重要。本次调查的受访者还表示,他们的主要关注点是结构化和非结构化数据规模的增长(66%)以及云计算的影响。他们还未能将这两大趋势联系起来,但两者带来的却是大数据时代的标志性产物——Hadoop和NoSQL。#p#远超你的想象然而,其他以非数据库管理员受访者为主要受众的调查报告却给出了不同的结果。结果,Forrester自己的调查报告显示,NoSQL已经实现了高达20%的采用率,这个数字在2017年将迎来翻番。至于用于实现数据库优先级排序的DB-Engines(根据各种求职数据和LinkedIn资讯等)指出,目前十大流行数据库中有3个属于NoSQL,排名甚至高于DB2和Postgres。和其他已经相当成熟的关系数据库。至于Hadoop,是的,451研究报告(自2013年以来)显示,Hadoop占全球企业整体存储容量的不到3%,但Gartner强调接受大型数据库,特别是Hadoop。趋势会越来越明显。每年,Gartner都会询问企业客户的大数据发展计划,其中Hadoop往往占有重要的比重,许多使用它的公司显然已经通过了概念验证阶段:几年前,BillyMarshall曾指出,“CIO是最有见识的群体”,说CIO往往对开源解决方案在企业中的大规模介入一无所知。今天,Hadoop和NoSQL的情况也遵循同样的趋势。不,Hadoop和NoSQL远没有今天OracleDatabase或MicrosoftSQLServer的地位和流行度,它们也不适合传统用例。但随着公司寻找更好的方法来存储和处理数量不断增加的非结构化或半结构化数据,数据库管理员将不得不使用Hadoop和NoSQL。原因很简单——他们别无选择。原标题:大数据改变的事情比你想象的要少
