【作者注】最近一次去荷兰出差,我开始思考巴鲁克·斯宾诺莎(荷兰)的深远影响。斯宾诺莎是一位伟大的文艺复兴时期哲学家,与他同时代的人不同,他强烈反对传统的神学观点。他的名言之一是:“不要对新想法感到惊讶。因为我们都知道,一些事情不被很多人接受并不意味着它本身不是真的”。他认为,除非在相对特定的情况下,事物本身并无好坏之分。这让我想起了从黑暗的“前云时代”发展而来的大量数据库,尽管当今市场上有各种各样的数据库,但每一个都有自己的用途。我们可以自由地从多个数据库中进行选择,选择多方面的层,将整体分解为微服务,并通过利用各种云数据管理工具和技术来创新构建现代云应用程序。云计算(BC)的前世今生,我们如何看待数据库的历史遗留问题:在计算机信息处理的早期,我们能够凭借SQL数据库的优势,统一数据管理领域。在那些落后的日子里,如果数据增长到几千兆字节,数据库就被认为是非常大的。然后在中世纪,MySQL在1995年提出了开源许可模式,在数据管理领域创造了第一个连锁反应。随着数据越来越大,越来越多的应用开始转向云计算,数据库技术出现了新的趋势。大数据分析和云应用的普及,在数据管理领域掀起了一场轰轰烈烈的启蒙运动。进军加速。与MySQL时代相比,现在的形式——随着云计算战略的出现——海量数据对象的出现和分布式数据管理——真有一种文艺复兴之旅的感觉。当今的云计算(CE)在我们当前的云时代,数据管理是数据库数据存储和堆叠的复杂网络。随着MongoDB、HBase、Cassandra、CouchDB、DynamoDB等数据库的流行,Google、Facebook、Amazon等纷纷将大量NoSQL数据库推上风口浪尖。掌握每个数据库并弄清楚为什么要使用它是一个巨大的挑战。CAP定理是理解底层技术和广泛了解要使用哪些NoSQL数据库的便捷工具。CAP定理图现代云管理策略在当今时代,数据管理需要分解为许多不同的维度。在选择新的闪亮的NoSQL数据库之前,我们应该仔细考虑使用经过验证的SQL数据库。在选择特定技术之前,了解数据管理的短期和长期业务战略、权衡竞争优先级至关重要。每当我想评估数据管理策略时,我都会查看清单来帮助我做出决定(如下):数据的安全性和合规性考虑因素是什么?数据的短期和长期可扩展性如何?类型和目的是什么模式变化的频率是什么数据检索的延迟是什么数据的速率是什么数据的多样性是什么数据可用性要求是什么数据存储的搜索要求是什么数据是什么如何将数据处理成信息和见解数据如何分析和报告数据?数据是否存储在多租户环境中?数据管理的最大成本是多少?数据管理的层级有哪些?数据管理(备份/恢复)的生命周期要求是什么?对数据库感到舒服。随着微服务和容器化的使用,这种趋势正在加速。此外,大多数云应用供应商都意识到需要分离数据管理层,包括UI缓存层、CDN层、图分析层、业务层、业务分析层、安全层、报告层、物联网设备层等。层数众多,每一层都可以有自己的数据管理策略——只要数据受到保护,就可以通过RESTAPI访问。现在是进入数据库即服务(DBaaS)的激动人心的时刻,它为SQL和NoSQL数据库提供了一套成熟的DBaaS选项。例如,AmazonAurora提供MySQL和PostgreSQL数据库,Instaclustr提供Cassandra数据库系统作为托管在AWS上的服务。分析即服务(AaaS)所有三个云服务提供商都提供分析服务。采用云分析平台的最大障碍是对数据安全的担忧。AWS和Azure提供了一组强大的数据分析服务来缓解此类担忧。Azure分析服务以SQL为目标并提供强大的可视化PowerBI工具。图形数据库利用图形数据库革命,使解决方案能够更快地从图形匹配查询中受益,同时有助于加速基于网络安全、推荐引擎、IT运营、网络等方面的邻接关系的搜索。例如,在客户的物联网网络安全产品中,我们使用ApacheSpark和CassandraDB作为分析层,基于MongoDB的网络安全编译,但生成的数据通过Neo4j图数据库进行组织,用于进一步分析网络安全威胁。这是数据管理分层分离的一个极好的例子,在这种情况下,***数据库被用来解决网络安全产品中非常复杂的问题。IoT数据库随着可行的IoT应用程序的出现,需要以专门的方式处理从设备层收集和处理的大量数据。我们已经成功地使用了一个相对较新且令人兴奋的开源数据库InfluxDB来高效地处理时间序列数据。因此,适当的应用程序可以使用InfluxDB数据库和相关的TICK堆栈进行数据管理:TICK堆栈图
