【.com快译】过去几年,数据的创建和使用方式出现了微妙但引人注目的趋势。据IDC预测,“全球数据总量将从2018年的33ZB飙升至2025年的175ZB,复合年增长率为61%。”这正在改变数据处理和分析的基本规则。这种数据趋势正在为一系列以前被低估的新用例铺平道路,并正在改变一些现有用例的处理和使用方式,这反过来又需要一种新颖、更现代的方法来适应这些场景。例如,来自许多不同数据源(如图像、文本、语音或视频)的不同数据集可以部分或全部实时组合,以支持有可能彻底改变我们生活方式的用例生活和做生意。我们今天面临的挑战不能轻易应对,因为它的步伐如此之快。市场上的大多数现有系统和平台主要是为特定类型的数据(当创建这些工具时)设计的(它们应该如此)。然而,正如我们所看到的,由于当前的最新趋势,数据的形状和大小正在发生变化,因此数据创建和消费方面的基本前提不再适用。因此,现有基础设施的要求和支持之间存在可以理解的不匹配。我们需要一种专门针对这一趋势开发的新方法,以适应和满足对大多数公司的生存至关重要的一组新用例。集成不同异构工具以创建同构解决方案框架的常用方法根本行不通。合并维度如果仔细观察,不同的问题空间正在核心合并。例如,对于监控日常操作的简单任务,我们需要在本地(边缘或设备内)和云端实时摄取和处理文本和语音等各种数据(数据流)水平,都具有预测性(AI)。由于执行此操作的速度和规模,几乎不可能使用孤立或“拼凑”的平台。这样的平台根本无法扩展。这是我们需要处理的第一个核心问题。我们还必须从解决方案空间整合参与的所有维度,以解决我们今天面临的不同挑战的这种大融合,这个问题只会变得越来越大,越来越难以应对。我们必须打破孤岛并创建一个融合的架构空间,然后该空间应该线性扩展以匹配数据的速度和数量。这种在解决方案空间中融合不同维度的做法将提供一种直接集成和支持不同格式数据的方法。高级抽象将为处理各种类型的数据提供一致的接口。数据流和人工智能的融合可以以绝对和预测的方式连续处理数据。直接集成将使用户完全控制系统捕获和处理的每个字节,减少高速精确处理的延迟。数据流处理将保证实时连续聚合、运行统计、事件预测及相关操作。这种融合优先的方法还将促进系统的真正线性扩展。如果是一个孤立的架构,我们发现对于不同的垂直领域,总是很难一起扩展,不可能进一步充分利用资源。但是有了融合,我们就不需要费心去扩展一个维度了,资源利用率肯定随之而来。进一步隔离(半隔离)的架构会强制产生过多的网络跳数和过多的数据副本。在这种场景下,即使处理效率很高,这种架构也无法实现低延迟(或高速)。我们需要最小化网络跳数和数据重复。通过融合,我们可以最大限度地减少网络跳数和数据重复,从而提高性能。结论各种数据的快速爆炸以及实时捕获和分析所有这些数据的突然需要迫使我们摆脱临时系统的传统分散式集成架构。我们需要采用直接融合计算模型的可扩展单元,这些模型不仅可以解决当前情况,而且可以在未来几年保持创新和市场定义。原标题:WhyANovelDataProcessingPhilosophyIsNeedaryForAnEmergingDataTrend,作者:SachinSinha
