当前位置: 首页 > 科技观察

PingCAP发布TiDB5.0打造具备完整HTAP能力的分布式数据库

时间:2023-03-12 02:21:22 科技观察

【.com原稿】PingCAP是一家企业级开源分布式数据库厂商。成立六年来,其研发的分布式关系型数据库TiDB已在全球范围内被超过1500名用户使用。企业在在线生产环境中使用它,既有银行、电信、医院等传统企业,也有腾讯、美团、新浪微博、哔哩哔哩等互联网企业。近日,PingCAP正式发布面向企业级核心场景的TiDB5.0版本。通过引入MPP(MassivelyParallelProcessing,大规模并行处理)架构,成为具备完整HTAP能力的分布式数据库,为高成长企业和数字化创新场景提供平台。栈数据服务平台。企业级数据库需要做到“省心、放心、不愁”。PingCAP成立之初的目标是做一个通用的数据库,因为基础软件必须通用才能有更高的天花板。因此,TiDB的开发从零开始,每一行代码都由PingCAP工程师编写,核心代码(自主可控率)100%。早期TiDB是救命产品,第一批用户是游戏公司。当游戏公司决定在哪些渠道投放广告时,数据库查询成为瓶颈。随着TiDB的出现,游戏公司在不修改代码的情况下实现了查询速度从20分钟到10秒的飞跃。而这个客户的需求其实是一个实时分析的需求,这也为后来PingCAP开发HTAP做铺垫。在获得第一个客户后,PingCAP逐渐积累了众多互联网企业客户。但很多客户最关心的是公司的产品是否应用于金融行业的核心系统。因此,PingCAP不断向金融等传统行业发展。但是,每个人对企业级数据库的理解都不一样。服务过大型传统企业、闭源、昂贵的软件,真的是企业级的吗?在PingCAP联合创始人兼CTO黄东旭看来,用户一定希望使用稳定、无差错、集成的数据库。因此,真正的企业级数据库应该是“省心、放心、不用担心”。业务代码尽量不修改,业务问题不用学新东西就可以解决,安心使用;数据无错误、无丢失、无性能抖动、无后顾之忧、无后顾之忧;业务的快速增长,数据库可以轻松应对,不用担心它带来的复杂性和挑战。TiDB5.0修炼内功。HTAP(HybridTransactional/AnalyticalProcessing,即混合事务/分析处理)数据库可以在单一数据源上同时支持在线事务处理(OLTP)和在线分析处理(OLAP)场景,避免了传统架构。与离线数据库进行大量数据交互。Gartner认为,HTAP数据库将成为数据库领域的重要发展趋势,一体化的数据平台将加速数字化转型。TiDB早在1.0版本就实现了OLTPScale(在线事务处理的规模扩展),4.0版本已经实现了初步的HTAP能力。黄东旭指出,TiDB5.0更多的是修炼内功,其中一个最大的特点就是与MPP相辅相成,让TiDB成为具备完整HTAP能力的分布式数据库。这一功能的加入,标志着TiDB终于成为一个跨OLTP在线交易业务和OLAP数据仓库的全功能数据分析数据库。这也是第一个开源的企业级实时HTAP数据库。5.0版本在原有HTAP引擎TiFlash的基础上引入MPP架构,提供与存储匹配的分布式计算引擎,进一步提升海量数据下的并行计算和分析能力。通过与TiDB-Server共享SQL前端,共享解析器(Parser)和优化器,TiDB为业务提供了一个集成入口,可以自动选择单机执行或MPP模式,隔离事务和分析负载,所以双方在高并发的压力下互不干扰。此外,TiDB5.0基于分布式架构,支持云原生和多云,可以弹性扩展吞吐量或存储,轻松应对高并发和海量数据场景,实现单栈数据服务。无论是企业级用户还是互联网用户,都可以通过TiDB系统构建数字化场景应用,无需关注底层架构。无论是SaaS厂商还是独立软件开发者,都可以通过简化的TiDB技术栈获得敏捷开发和轻松运维的数据库。TiDB5.0在性能方面有了很大的进步。通过提供聚簇索引和异步事务提交功能,在Sysbench、TPC-C等OLTP基准测试中实现了平均50%的性能提升。同时,TiDB5.0通过优化调度过程中I/O、网络、CPU、内存等资源的占用,大大降低了资源抢占带来的QPS(每秒查询数)抖动问题。在TPC-COLTPbenchmark测试中,测得的TPC-CtpmCjitter的标准差值小于或等于2%。在OLAP方面,TiFlashMPP在同等配置下,获得了数倍于GreenPlum的性能优势。未来发展据了解,PingCAP在成立之初就将开源作为核心战略。高度活跃的开源社区为TiDB产品的发展带来了飞轮效应。TiDB也是一个生态友好的数据库。TiDB5.0集成了更丰富的大数据生态,全新的Kafka连接器,支持S3存储服务,提供多种数据迁移、导入和共享组件,方便用户在自己的异构环境中使用TiDB。黄东旭指出,5.0是TiDB的一个里程碑,标志着TiDB成为一个全能的Real-TimeHTAP分布式数据库。但里程碑并非终点。所有基础软件都将在云基础设施的背景下被重新发明。PingCAP已准备好再次启动并将数据库返回到其原始状态。【原创稿件,合作网站转载请注明原作者和出处为.com】