当前位置: 首页 > 科技观察

趋势推动开源数据库程序的未来

时间:2023-03-23 10:24:40 科技观察

根据维基百科对开源项目的描述,“如今有超过180,000个开源项目和1,400多个独特的许可证可用,决定如何管理开源项目的复杂性增加了戏剧性地。”对于一个给定的项目,可能有无数种开源技术栈的组合。然而,这些应用程序产生的PB级数据最终汇聚在一个地方:数据库。尤其是用于优化和访问数据的开源数据库、工具和中间件。因此,如果企业选择一个项目作为基础,开源数据库程序是一个不错的选择。那么,是什么推动了从专有的、供应商驱动的创新向开源数据管理模式的转变?本文概述了推动开源数据库程序的未来,并重点介绍了一些可以帮助企业引领潮流的示例项目。云计算和SaaS开源代码存储库和云计算技术颠覆了技术创新。“数据是新石油”和“软件”两种观点正在吃掉世界”的冲突和碰撞推动SaaS行业的发展,这一切都发生在云端。开发者可以通过找到满足他们需求的服务,定制应用程序,并随时随地在任何具有Internet连接的设备上采用云服务。对用户来说,SaaS软件已经开发“开箱即用”,自动与数据库匹配。预计在软件中执行的任何操作或查询都将在桌面或移动设备上得到即时响应。从某种意义上说,这一切对用户来说就像魔术一样,但对于开发人员来说,开发新的计算模型和代码以保持其运行是每天的挑战。开源社区因此成为推动这一创新的引擎。在这种相对较新的计算模式中,开发人员可以将应用程序快速推向市场,而无需在基础设施成本和维护方面进行大量投资。这在20年前是不可能的,它把几乎所有的企业都变成了软件驱动的公司。随着云计算与开源数据库的结合,使开发人员能够使用来自亚马逊和谷歌等公司的创新存储和访问技术,这对供应商来说可能很难做到。在2021年9月发布的最新季度报告中,甲骨文的专有数据库许可收入比去年下降了8%,但其云计算业务增长了40%。以传统银行的专有数据库和代码为例,它们突然发现自己在用户群和市场上与Chime等挑战者银行展开竞争。ChimeBank仅存在于云中(他们没有分支机构)并且作为移动优先的银行SaaS应用程序出现。ChimeBank使用云优先开源战略打造了一家价值数十亿美元的公司,因此采用云计算服务是传统银行争相效仿的战略。混合云混合云是开源数据库大放异彩的地方。顾名思义,混合云使用内部部署、私有云和第三方云服务的组合,并在这些平台之间进行编排。常见的应用程序在这些平台上运行。这种配置最近得到了发展,以支持企业将某些工作负载保留在本地的需求,同时享受云计算所提供的好处。开源允许企业拥有一组通用工具,这些工具可以适应所有环境中的用例,例如灾难和恢复以及平衡工作负载,即使数据库不同也是如此。大数据的快速增长和复杂性是由于移动流量、云计算流量以及包括物联网和人工智能在内的新技术的激增。根据ResearchAndMarke的2020年数据使用报告,全球每天产生超过2.5TB的数据。企业需要在数据存储和检索方面不断创新以跟上步伐。开源是数据科学创新以及硬件优化和编码效率的最佳途径之一。数据是开源数据库项目将继续最受欢迎(仅次于操作系统)的最关键原因。它不断积累,物联网和社交媒体等新应用每天都以大量、高速和高度可变的格式生成大量信息。组织需要一些方法来大规模分析这些数据。这就是开源数据库胜过传统数据库的地方。尽管近年来开源和社区开发项目的动态发生了变化,但对于99%的应用程序,社区开发仍然是促进数据访问创新的最佳方式。与数据库无关的工具和中间件的新现实是一个技术领域,在这个领域中,企业对数据库服务采用更加分布式的方法。需要探索来自不同数据库供应商的多个数据库实例,以创建一个可以托管在本地、云端或两者的混合数据库,但通过一组标准的工具和中间件访问数据来简化。无论数据库是SQL还是NoSQL,现代关系数据库在表、行和列方面都有一个共同点。这种数据结构允许新的访问工具统一分布在混合基础设施中的数据。例如,ShardingSphere等开源解决方案具有与SQL无关的工具,可以跨分布式数据存储查询和检索数据。现在的趋势是,客户不想被微软或IBM等大供应商锁定。源代码访问供应商锁定在30年前被认为是一件好事。如果出现问题,用户可以从他们的供应商那里获得支持,他们的工程师团队会不断修补和更新他们的应用程序。企业还需要支付巨额的许可证、技术支持费用和高额的软件升级年费。例如,一个基于Oracle平台的应用的生命周期成本可达数百万美元,而且其功能仅针对数据库软件和维护,不包括开发。在敏捷代码开发时代,供应商锁定不再是一件好事。开源的关键是源代码部分。通过访问共同策划的源代码,开发人员可以根据自己的需求和优先级进行更改,而不是软件供应商的需求和优先级。开源社区对源代码的访问不仅对开发者或企业有价值,对开源社区成员的整个生态系统也有价值。这是一个良性循环,采用开源软件的人越多,开发的项目就越多。就像一篇好的博客文章或推文广为传播一样,好的开源软件可以利用这种网络效应。开源社区是这种病毒式传播的来源。一个由数十名贡献者和数千名开发人员组成的全球社区为从头开始构建的分布式系统的数据库项目迭代开源代码。当由不同的社区开发时,这种方法比专门的开发团队在专有系统中破解漏洞产生更稳定的软件。前瞻性开源数据库社区的示例包括ApacheShardingSphere、CockroachDB、Yugabite和ClickHouse。例如,ShardingSphere仅在亚洲就有超过450名开源代码库的贡献者,并且正在全球范围内迅速传播。数据库软件的贡献和采用在未来几年肯定会显着增长,因为企业需要不断增加的访问、速度和对不断增长的数据流的控制。例如支持开源数据库项目的Momentum,开源贡献者社区已经解决了多个版本的Momentum中的主要缺陷,创建了库、存储库、文档甚至YouTube视频来为新贡献者提供激励。O'ReillyMedia和IBM在2020年对3,400名开发人员和技术经理进行了调查。调查报告显示:94%的受访者认为开源软件等于或优于专有软件。70%的受访者更喜欢使用来自开源云计算提供商的软件。65%的受访者认为参与开源项目会带来更好的职业机会。虚拟软件目录开源应用程序很容易找到。如果你在谷歌搜索引擎上搜索“开源数据备份和恢复”这样的应用程序,搜索结果显示至少有17个免费的开源备份解决方案,甚至更多。截至2020年1月,GitHub报告称拥有超过4000万用户和超过190万个存储库(包括2800万个公共存储库)。用户可以通过多种方式搜索GitHub,例如,GitHub支持对某些字段(如存储库标题、描述和自述文件)进行高级搜索。如果你想找到一些好的存储库来了解数据库的东西,你可以这样搜索:in:namedatabase。与专有产品套件相比,用户更有可能在开源软件领域找到可以随时修改的相关解决方案。CIO与安全根据调查,超过三分之二的CIO担心被云计算提供商锁定。因此,这已成为采用开源数据库的另一个主要驱动力。勒索软件时代,数据安全关乎企业生存。开源技术通过提供对源代码和配置的完全访问权限,使企业能够完全控制其安全需求,从而允许他们以任何喜欢的方式扩展软件。许多人担心开源的安全性。许多企业的迅速采用似乎是对开源争论的回应。事实上,没有一家企业不会受到开源数据库的影响。新兴实例随着元宇宙等新技术的发展,人们将体验到一系列新兴技术,这些技术将成为开源数据库程序的首选。例如,ApacheShardingsphere提供的新兴开源生态系统及其与技术无关的分布式数据库即插即用模块为作为贡献者或企业的开发人员提供了易用性和采用性。Kubernetes(谷歌的云容器编排技术)是开源数据库部署的另一个关键API,程序员可以从中受益。未来五年,开源开发将由需求驱动。行业趋势表明,开源将不再是一种选择,而是成为一种标准。因此,企业需要积极拥抱以保持相关性。原文链接:TheFutureTrendsDrivingOpen-SourceDatabasePrograms,作者:YacineSiTayeb