核心摘要:中国数据库市场规模:据艾瑞咨询统计,2020年中国数据库市场总规模将达到247.1亿元,同比增长16.2%。预计未来三年将保持高增长,这将受到许多积极因素的推动:1)政策支持、本地化和数字化转型将推动需求增长;3)各类厂商积累了大量资金,产品和技术日趋成熟;4)企业对基础软件的需求支付意愿逐年上升。中国数据库市场格局:1)多类型数据库百花齐放,关系型数据库占据绝对主流。2020年,中国关系型数据库的市场份额将达到90%左右。国内传统厂商市场份额上升至7.1%,而国外厂商则下降至52.6%;3)2020年中国公有云部署模式的数据库市场份额占比32.7%,近年来增速有所放缓。达到47.2%,云厂商将成为中国数据库市场份额最大的阵营;4)初创厂商不断涌现,预计未来5年将有10倍以上的增长空间。中国数据库市场的挑战与趋势:大约从2010年开始,中国数据库市场进入了充满活力的十年,但在分布式改造、本地化、数据迁移、跨库管理、软硬件结合等方面仍面临挑战。硬件。艾瑞咨询认为,“多场景、一体化、云湖仓一体化、开源、人工智能”将成为中国数据库市场未来发展的必然趋势。01供给侧全球数据库发展历程数据库与互联网发展相互促进,技术和产品趋于成熟和完善受益于市场需求和技术沉淀,进入百花齐放的快速发展期从20世纪80年代开始,我国的数据库市场开始逐步发展起来。在经历了技术初期和国外厂商的垄断期之后,进入21世纪初,基于863计划、核高基计划等国家政策的扶持,一批具有大学背景的国内厂商涌现。成立,打破了甲骨文和IBM的一统天下。2010年代,随着市场需求的增长和技术的沉淀,一批云厂商和新兴的独立厂商开始提供数据库产品。近年来,借助本土化热潮,众多软件厂商、集成商、运营商等也开始进入市场,发展自己的数据库能力。中国数据库产业地图中国数据库市场规模政策与数字发布需求,2020年市场规模将达247.1亿据艾瑞咨询统计,2020年中国数据库市场总规模将达到247.1亿,较2019年增长16.2%,复合年增长率(2020-2025e)高达15.6%。2020-2022年,中国数据库市场将呈现高速增长,这是多方面因素造成的:1)政策利好,国家大力鼓励国产数据库厂商发展;2)需求驱动,本地化、数字化驱动需求爆发式增长;3)供应端到端多厂商发力,传统、初创、跨界厂商积累较多,产品和技术经过工程实践,走向成熟;4)国内企业支付基础软件和IT支出的意愿逐年上升,有利于市场的长远发展。中国数据库市场发展特点多种数据库百花齐放,关系型占据绝对主流。随着互联网的发展,各类数据呈爆发式增长,各种创新业务场景层出不穷,进而推动了供给侧厂商的技术和产品架构的创新。从2010年代左右开始,各种类型、技术路线的数据库厂商相继成立,中国数据库市场进入了百花齐放的阶段。但从商业价值来看,中国数据库市场的收入仍主要来自关系型数据库,NoSQL数据库更多是开源模式,产生二次开发和服务费。在政策的帮助下,国内厂商厚积薄发,市场迅速扩大。借助政策红利,国内厂商经过多年的技术研发和经验积累,市场份额逐年提升。在国内阵营中,以“大梦、人民大金仓、台大通用、神州通用”为代表的一批2000年左右成立的传统国产数据库厂商,近年来开始发力。他们已经从购买源代码和依赖开源转变为自力更生。研发、实力不断增强,在党政军市场均有良好表现。同时,也开始向能源电力、运营商、交通运输等其他行业快速扩张。此外,初创企业、云厂商、ICT厂商近年来也开始发力数据库市场,国内阵营日趋强大。相比之下,虽然甲骨文、微软、IBM等国外数据库厂商在核心OLTP场景中仍占有较高的市场份额,但整体市场份额正在逐渐被蚕食。公有云数据库增速放缓,未来仍有渗透空间。中国公有云部署模型数据库在过去三年增长迅速,2020年市场份额达到32.7%,虽然未来增速会放缓,但仍有一定的渗透空间。从应用逻辑来看,数据库是为数据服务的,数据对业务的应用最终产生价值;反过来,业务端的创新和数据的变化也会反馈到数据库市场。从最终业务端来看,现阶段云数据库更多应用于互联网行业和传统行业的互联网场景。未来,随着行业端更多的业务创新,有望进一步拉动对云数据库的需求。借助HTAP、NoSQL等新技术,初创厂商不断涌现。一批2015年前后成立的初创厂商,将借助NewSQL、SQLonHadoop、NoSQL等新技术架构,以开源或垂直领域商业化的思路,逐步壮大自己的市场。影响力,在互联网、金融、物联网等行业有着不俗的表现。从现阶段来看,其收入市场份额较小,但增长速度较快。是中国数据库市场增长最快的赛道。预计到2025年实现十倍扩张。随着市场大浪淘沙,未来初创数据库厂商的赛道将趋于趋同,市场份额将集中于一小部分优秀厂商具有核心技术优势和高价值应用场景。02需方采购流程不同企业的组织结构和选型要求不同,采购流程也有一定差异。选择指标综合考虑了外部因素、产品技术相关因素和服务价格因素。参照企业采购流程。后期将外部因素(自身技术路线、资质、品牌口碑和行业案例、生态建设等)、产品技术相关因素(一致性、兼容性、扩展性、性能、功能丰富度、安全性等)综合考虑。以及后期的价格服务因素(解决方案、性价比、服务响应速度、培训体系等)。示例场景——金融对“高可用/强一致性/低延迟”的要求很高,分布式改造是下一步的重点。对于银行等金融企业,其业务数据价值高,因此对数据库“高可用、强一致性、低延迟”的要求极端。在TP场景下,银行接下来选型的重点是分布式改造最初,解决方案主要是“中间件+分库分表”或者“原生分布式架构”,中间件路由方案成熟,性能好,是现阶段大部分客户的选择;但是,原生分布式架构在可扩展性方面具有天然优势,未来发展空间更为广阔。示例场景——互联网教育业务快速扩张,注重可扩展性、成本控制和成熟度。受益于互联网和疫情,教育行业已经近年来发展出“收入高增长、业务快速迭代”的特点,因此,企业更加注重业务的可扩展性。选型时的数据库,希望产品能及时响应公司版图的扩张和业务的变化。同时,教育行业也不是强技术型。企业对数据库的一致性、高性能、高可靠性没有极端的要求。将更多地考虑产品成本控制和成熟度。企业在选型时相对保守。虽然他们看好一些新产品(如HTAP数据库、云原生数据库),但希望工程实践丰富的数据库产品能够开箱即用,容易招到专业人才。因此,MySQL数据库成为了很多(互联网)教育公司的最佳选择。考虑到成本和便利性,云主机在业界也很受欢迎。03ChallengesandTrendsChallenge-分布式实践还存在很多问题。横向扩展的设计思路并没有什么创新,但在历史上并没有得到广泛应用。一方面是因为分布式环境使得事务ACID特性难以实现,另一方面是因为单机的性能升级可以满足企业的数据需求。但是,随着摩尔定律在一定程度上的失效以及互联网的发展,硬件性能的升级已经无法匹配海量数据的增长。分布式数据库近年来受到广泛关注,许多厂商都推出了相应的分布式数据库产品。但在分布式的前提下,还有很多问题需要探索,比如分布式事务的解决、架构的创新、数据分片的智能化、企业级能力的提升等。挑战二鑫创为国内厂商提供了成长的沃土,未来的发展仍需市场磨砺。信创,即信息技术应用创新,是在复杂的国际政治背景下,以国家政策为导向的新一轮信息产业创新。“新创”对于产业和需求方企业来说都是一个重要的机遇。国内数据库厂商利用政策利好拓展市场,将产品放在实际场景中打磨,不断更新迭代,实现自身技术实力弯道超车;传统行业企业、政府等也可以借此机会,实现业务的数字化转型和创新发展。然而,新创并非一日之功。从产业发展规律来看,新一轮技术变革往往需要6年左右的实践和积累,需要上下游厂商和企业长期共同努力。挑战三数据迁移和多库管理提出新挑战面对当今市场业务形态、商业模式多样化,需求变化频繁,数据库和应用系统的存在形式越来越多。一个企业往往有多个系统,从本地到云端,从关系型到非关系型,从OLTP到OLAP,从国外品牌到国内品牌,数据库之间的跨库查询、数据导出和迁移、结构变更等操作都有已完成。成为常态。数据频繁迁移、多数据库共存的现状大大增加了企业后期的使用成本(运维成本、人力成本、多种技术栈的学习成本、迁移成本、二次开发成本等),同时也建议对数据库厂商进行“统一管理”。“新挑战。挑战4CPU、内存等硬件变化为数据库设计提供了更多的想象空间。数据库系统遵循“木桶理论”。硬件和软件作为系统的核心部件,相互制约,相互促进。新硬件的发展给数据库软件的发展带来了新的挑战。例如,多核CPU技术日趋成熟,但在实际应用中,并发控制存在冲突,限制了核数增加带来的性能提升。如何优化多核CPU调度给厂商提出了新的问题。与此同时,大容量内存和高速硬盘开始普及,NVM非易失性内存逐渐走向成熟。内存的潜力被释放,如何用新的存储介质设计新的数据库架构还有待探索。因此,甲骨文、阿里等一些领先的数据库公司开始探索数据库软硬件一体机的设计与实践。趋势一:多场景|融合结合细分场景多元发展是必然选择,用户简化需求驱动的融合融合也不容忽视。从产品角度来说,不同的场景有不同的特点,影响数据库的读写性能、吞吐量、一致性等方面的要求各不相同。为了支持不同场景下的不同需求,数据库多样化是必然的选择。比如物联网场景写入的数据量特别大,对实时性的要求特别高,但是数据天然是时间顺序的,具有静态的特性,所以时序数据库有更多优于传统的事务数据库。从用户的角度来看,除了一些领先的互联网公司,其他大中小型企业的IT人员比例并不高,相应的数据库团队数量会更少。对他们来说,各种日新月异的技术栈和各种类型的数据库产生了巨大的学习成本和维护成本,因此他们希望有一个集成的产品/平台直接使用或统一管理。对于这类企业,他们更倾向于购买能够满足其全部需求70%的集成产品,而不是能够100%满足其部分需求的多种产品。目前市场上的HTAP/NewSQL数据库、多模式数据库、统一管理平台,满足了企业简化集成的需求。因此,多场景背景下的“融合”也是不可忽视的趋势。趋势二:DBaaS解决了弹性伸缩的问题,为供应商和企业提供了更多的想象空间。随着企业业务规模的扩大和数字化转型的推进,也对数据库系统提出了新的要求:传统的建设模式项目周期长,无法匹配新的业务速度;企业部署多套数据库系统,系统分散,缺乏统一的管理平台;资源采购和系统规划按现有规模建设,难以随业务变化灵活扩缩容。DBaaS(DatabaseasaService)是以服务化的方式为数据库提供基础IT资源,并通过多租户和动态调整来解决成本和响应问题。一些对数据自主性和安全性要求较高的大型企业,可以选择以私有云或专有云的形式进行数据库的云化改造。趋势三:创新湖仓一体化架构,实现海量大数据在线交易和在线分析。自20世纪80年代以来,数据仓库技术不断发展。特别是MPP架构使得DBMS能够处理海量数据,满足企业通过数据分析来支持业务决策的需求。.然而,随着互联网的发展,许多企业需要同时处理非结构化数据、半结构化数据和海量结构化数据。然后数据湖诞生了。它可以直接存储各种格式的原始数据,并根据用户需要进行计算。它具有灵活性的优点。然而,数据湖虽然适合存储多样化的数据,但缺乏一些企业级的功能,在实际实施中存在诸多挑战:缺乏数据处理、实时分析困难、数据查询性能差、不支持酸交易。面对企业海量大数据场景下在线交易和非结构化数据治理的需求,以及数据仓库/数据湖架构的局限性,以Snowflake、Databricks、阿里云为代表的新一代“湖仓一体”,和巨杉数据库》数据库厂商正在迅速崛起,数据仓库和数据湖在一体化湖仓架构下打通,结合两种架构的优势,底层多套存储系统共存共享数据相互之间,形成一个资源池,上层的各个引擎都可以通过一个集成的封装接口来访问,实现同时支持在线交易和在线分析趋势四:开源模式成为数据库厂商的突破口工业互联网时代,从产业发展角度看,开源模式提升了“效率”一方面是数据库产品开发的效率”。重复开发;另一方面,也有助于产品的技术“创新”。开源社区最大程度汇聚全球资源,为开发者提供交流思想的空间,从而加速创新灵感的诞生。对于厂商来说,虽然从表面上看,企业不能从部署开源中获得直接收益,但在这个过程中,可以布局产品的生态建设(包括人才培养、市场教育、实践反馈、企业文化、产品影响力、支持等)周边产品等),从而为自己取得有利的战略地位。在今天从移动互联网向工业互联网发展的转折点,开源模式或许不是所有云厂商、传统厂商、新兴厂商拓展市场的利刃。趋势五:智能人工智能扩展DBA能力半径,优化数据库性能。随着移动互联网向工业互联网的发展,数据每天都在呈指数级增长,呈现多模态特征。面对复杂海量的数据,数据库的种类越来越多,调试的范围也越来越广。但是大部分的优化任务还是落在了DBA身上,需要手动调优,使得人的能力逐渐跟不上数据库的发展。人工智能可以弥补人类能力的不足,解决许多存在多年的数据库问题,如资源调度、索引设计与优化、查询优化、负载均衡设计、缓存失效等。AI可以有效预测,通过优化算法分析和自动化任务,从而降低人力成本,大大提高数据库性能。尤其是未来随着云端数据库的广泛普及,资源智能调度将成为供应商需要面对的下一个课题。
