有人认为,计算和I/O密集型大数据工作负载不会脱离云计算,而是留在现有的数据中心进行安全设施。如今,似乎整个IT世界都在迁移到云端,但许多用于计算增长和I/O密集型分析的新大数据工作负载仍保留在企业的本地数据中心,而不是云端,至少目前是这样。新的网络工作负载围绕移动设备、云服务、社交技术和大数据构建,即所谓的第三平台。正如IDC所描述的那样,可以迅速压倒现有的数据中心基础设施。这些工作负载具有不可预测的规模、不同的组件,并且可以生成、处理和存储大量敏感数据。同时,公有云的成熟度和成本并没有完全满足这些新工作负载类型的需求,尤其是大数据分析的实验性组织。服务器市场最近的数字反映了这些动态。近年来全球服务器市场持续增长,IDC报告称,IBM的高端服务器业务在2015年出现下滑(第四季度下降17.2%)。总体而言,2015年服务器收入增长2.3%至509亿美元,单位出货量与2014年相比同比增长2.9%至920万台。就数量而言,超大规模IT公司和电信运营商为支持新工作负载而进行的投资有所增长2015年第四季度增长4.9%,达到108亿美元。与此同时,2015年第四季度,企业对第三方平台工作负载的新可扩展系统的投资增长了21.1%,中端服务器市场增长到14亿美元。毫不奇怪,如此多的分析工作负载仍在本地运行,而且公司正在为这些第三方平台兜售应用程序,甚至一些完全支持云的应用程序。以基于ApacheHadoop软件的数据管理厂商Cloudera为例。“当我们构建我们的应用程序时,我们认为主要的部署模型是云计算,”Cloudera产品副总裁CharlesZedvansko说。以上企业均在本地部署运行。为什么Cloudera还没有放弃云计算?首先,对云部署模型的分析立即打消了很多客户不需要迁移到云的想法,或者可能出于安全原因。“人们看到拥有大量数据的组织,如联邦政府、金融服务业、电信运营商等,在他们的数据中心进行了大量投资,因此不需要这种外包能力,”Zedvansko说。.同时,那些用户会考虑数据中心托管服务,很多人期望Cloudera不仅仅主要处理Hadoop。“他们希望我们帮助托管他们的数据中心,而且我们有很多预约。”“利用AmazonWebServices(AWS)并不是一个真正的选择。公共云服务处于起步阶段,实例类型有限,很少有企业客户实施它们。因此,Cloudera构建并维护了自己的数据中心,”他说。这是一个昂贵的***。“但从那以后发生了很多变化,”Zedvansko说。现在Cloudera可以为大量基础设施即服务提供商托管数据中心。AWS和WindowsAzure都支持强大的实例类型,数据处理的工作量要求高。云计算中也有更多的数据和应用需要分析。EnterpriseStrategyGroup的高级分析师NickRoda表示,没有正确的方式来托管工作负载,尽管云计算具有灵活性因此,企业正在考虑主要使用本地基础架构来处理大数据分析工作负载。在一项调查中,ESG发现,当谈到新的大数据基础架构时,18%的受访者表示他们计划使用专用(非虚拟化)服务器来处理分析工作负载;30%的人关注传统的虚拟化基础架构;21%的受访者正在考虑使用Oracle和Teradata的专用分析设备。只有21%的受访者正在考虑公共云,而另外10%的受访者正在考虑混合公共/私有云部署。“那里有各种各样的部署选项,人们仍在试验中。“通常情况下,围绕大数据服务器的决策最终会基于超出工作负载需求的其他因素。有时人们的想法就是我们一直这样做的方式,人们坚持他们的意见或认为最佳实践。”Rhoda说,“就是说,分析应用程序与其他工作负载有不同的要求,有很多变化,有人说他们现有的基础设施完全符合他们的新要求。”他说,任何新的基础设施都应该评估其支持大数据属性的能力,例如:?可扩展性。?与位置无关的适当性能。?成本效益。公有云总是更便宜的假设不一定适用于分析工作负载。让数据栩栩如生对于大数据工作负载,这里最重要的是实时处理的数据。“如果您的社交平台是基于云的,那么它对您的基于云的分析平台就有意义。“如果数据已经存在于内部,则在数据中心服务器上处理它以最大限度地减少网络开销。这也加快了访问时间和分析过程。提供良好的数据访问时间尤为重要,因为在使用分析数据库的员工中Rhoda说:“已经急剧增加。只有业务分析师、数据科学家和一些高管等少数人需要这些数据库,而目前一些组织中高达40%的员工依赖这些数据。例如,卡车司机可以查看在优化的运输路线上,或销售代表正在考虑更新库存和定价等。事实上,数据的位置是许多分析供应商的指南针。”无论您在哪里创建数据,数据都会留在那里,因为移动它非常困难。”Zedvansko说。从传统的仓储公司到服务提供商,不同行业的制造商都希望吸引企业来处理他们的大数据工作负载。
