当前位置: 首页 > 科技观察

理解数据库虚拟化的五个关键

时间:2023-03-20 19:33:22 科技观察

我们正在经历一场令人难以置信的复兴。长期以来被嘲笑为过时的数据库突然成为业界的宠儿。在权威人士宣布数据库几乎已死多年之后,一种新型的初创公司正在引起华尔街的注意。然而,IT领导者仍然难以有效地将他们现有的工作负载迁移到这些系统。供应商锁定数据库是一个传奇。没有其他部门对其用户产生如此大的影响。自然地,供应商锁定使客户对现有技术心存感激。然而,它也让竞争和新贵望而却步。Snowflake的首席执行官感叹打入这个市场有多么困难,他说,“Teradata让他们很难离开他们的平台。”随着数据库虚拟化(DBV)而不是数据虚拟化的出现,一种新的方法登场了。DBV声称要打破供应商对数据仓库技术的锁定。适用性如何?IT领导者如何评估这项技术?以下是关于DBV的五件事。1.DBV是如何工作的?DBV平台位于数据库和应用程序之间。它使为一个数据库编写的应用程序能够在另一个数据库上本地运行。所有查询和通信均实时翻译。例如,为Teradata编写的应用程序可以直接在MicrosoftAzureSynapse上运行,甚至“不知道”它们不再在Teradata上运行。DBV是完全透明的,目的是应用程序不需要或只需很少的调整。这不仅包括标准SQL,还包括专有扩展。为了在实践中取得成功,还必须支持加载程序、驱动程序和实用程序。因为DBV系统实现了数据的查询和转换,所以它们可以以相当低的开销运行。实际的数据处理总是在数据仓库本身上执行,利用系统的大规模并行处理(MPP)功能。2.什么时候使用DBV而不是传统的迁移?在传统迁移中,所有现有的SQL代码、驱动程序、工具和实用程序都将替换为新目标系统上的对应项。这可能是具有少量应用程序的紧凑型数据仓库系统的首选方法。只有有限数量用户的数据集市可能有资格这样做。但是,对于复杂的企业数据仓库(EDW),DBV可以明显优于传统迁移。DBV以最少的时间、成本和风险完成工作负载迁移。3.DBV可以承担我的工作量吗?一些工作负载广泛使用专门的功能。还有一些功能使用了早于标准化工作的功能。换句话说,没有两个数据仓库工作负载是相同的。这会使评估DBV系统的覆盖范围变得困难。支持功能的完整文档似乎是可取的,但实际上并不是很有帮助。大多数客户无法简洁地描述他们的工作负载当前正在使用哪些功能。更复杂的是,查询或函数的原作者通常已不在公司。然而,这不一定是采用DBV的障碍。由于DBV的采用风险较低,因此它可以实现非常有效的概念验证(POC)实施。客户可以在不更改其应用程序的情况下使用DBV。他们可以直接在POC中测试他们的实际应用程序。POC然后可以快速识别任何缺失的覆盖范围。重要的是要了解虽然100%的覆盖率看起来很可取,但通常90%就足够了。处理其余部分通常只需要微不足道的努力。4.DBV与数据虚拟化有何不同?数据虚拟化是一种相关但完全不同的方法。要使数据虚拟化成功,首先要重写所有应用程序并采用SQL的抽象方言。然后,也只有这样,它才能防止未来供应商锁定。主要应用领域是不需要考虑已有应用的“绿地”场景。相比之下,DBV打破了现有的供应商锁定。它使应用程序保持原样。随着时间的推移,这可能会导致各种各样的不同应用技术。然而,这可能不是什么大问题,并且会被新数据技术的采用很好地抵消。5.DBV能否将EDW重新平台化为任何技术?每隔几年,一项新技术就会挑战企业数据仓库系统的霸主地位。新来者通常在一个重要方面优于现有堆栈。例如,新技术可能更具可扩展性。另一个可能会简化数据共享。还有一些对开源开发人员更有吸引力。通常,专家团队可以构建自定义解决方案,将工作负载从EDW卸载到大多数新技术。然而,功能上的差距越大,运行这些系统所需的软件工程就越多。例如,将EDW迁移到NoSQL系统在技术上可能是可行的,但在经济上并不总是合乎需要。要使DBV成功,源和目标必须有意义地相似。但是,这不需要等效功能。DBV可以弥补大多数高级功能,例如存储过程、宏,甚至不支持的数据类型。目前,云原生PaaS解决方案在DBV环境中最为成功。选择正确的迁移方法在为现有EDW选择新的目标系统时,需要考虑许多因素。一种经常被忽视的方法是迁移方法。DBV在打破供应商对遗留数据仓库的锁定方面非常有效。通过将迁移方法纳入他们选择的目标系统,IT领导者可以优化快速采用,同时控制风险和成本。