【.com快译】人们称它为“大数据”是有原因的,它很大。但是理解信息数字化的增长并不容易。为此,我们精心梳理了这10组震撼人心的数据,从多个方面反映了数据的现状和未来趋势。1、根据IDC的《DataAge 2025年》报告,到2025年,全球数据圈将从2018年的33ZB扩大到175ZB,年复合增长率为26%。然而,实际上只有大约9ZB的数据会被存储,高于2015年的0.9ZB。据该研究公司称,只有大约三分之一的存储数据会被实际使用。2、根据CoughlinAssociates的数据,2020年出货的传统硬盘(HDD)、固态硬盘(SSD)和LTO磁带机的年存储容量预计将达到1300EB左右,到2025年将达到4500EB,其中其中HDD在容量中所占份额最大。据IDC预测,到2025年,HDD将占企业存储需求的80%以上,传统SSD约占15%,而较新的NVMe-NAND固态设备将占不到5%。图13.根据Statista的数据,HDD出货量在2010年达到6.513亿台的峰值,并在2019年下降到3.163亿台。但是,据多个消息来源称,随着存储需求的增加,HDD出货量预计将在未来几年再次开始增长。(显然,HDD的容量已大幅增加,使组织能够在更少的HDD上存储更多字节。)4.端点设备上的数据存储将直线下降(尽管出现了超快的5G网络)。事实上,从使用手机、PC和IoT设备等端点存储数据到使用核心数据中心的转变已经完全扭转了2015年大多数数据存储在端点上的情况,根据IDC的《DataAge 2025年》报告,企业数据存储相对较小。5.根据IDC的《DataAge 2025年》报告,2018年到2025年,需要交付超过22ZB的存储容量才能满足存储需求,其中约59%的容量将来自交付的硬盘。存储在SSD(包括NVMe)上的数据会增加,但不会对HDD存储的增长产生太大影响。图26.根据Domo的第八个年度《数据永不休眠》图表,消费者在网上花费100万美元,进行140万次视频和语音通话,在Facebook上分享150,000条消息,在Netflix上观看404,000小时的视频流。7.根据IDC2020年1月发布的《希捷Rethink数据调查》,每小时创造的数据比20年前全年创造的数据还要多。8、根据IDC的《DataAge 2025年》报告,到2021年,存储在公有云中的数据将超过企业数据中心。(这个数字是在新冠疫情之前,新冠疫情加速了很多组织的云迁移计划。)9.AWS目前在全球有77个可用区(AZ),并计划再增加3个。根据TPM的2014年数字估计,这可能意味着AWS今天在全球拥有和运营150到220个数据中心(假设每个AZ平均有2到3个数据中心)。如果每个数据中心包含50,000到80,000台服务器(根据AWS工程师JamesHamilton在re:Invent上的演讲,2014年就是这种情况),这意味着AWS运行着750万到1760万台服务器。只有贝索斯知道AWS存储了多少数据。图3.AWS目前有77个可用区,每个可用区通常包含2到3个数据中心。10.每个连接的人至少每18秒与数据交互一次。其中许多交互都归因于全球数十亿联网的物联网设备,预计到2025年这些设备将产生超过90ZB的数据。据IDC称,在未来五年内,每年约有10亿人开始与数据交互天。大数据可能不会像2015年那样成为头条新闻,但最初将大数据推向聚光灯下的潜在驱动因素仍然适用,而且在某些情况下实际上还在加速发展。也许这种现象需要一个新名称。原标题:10个让你大开眼界的大数据统计,作者:AlexWoodie
