当前位置: 首页 > 科技观察

MySQL等传统关系型数据库弱!GPU数据库是未来趋势!

时间:2023-03-13 17:18:25 科技观察

在数据库市场上,似乎已经很久没有一个数据库能够撼动MySQL的地位了。我们看惯了MySQL占据各大数据库榜首。MySQL确实是一个很棒的开源数据库,也是目前使用最广泛的数据库。甚至很多业内人士认为,未来属于MySQL,但事实真的如此吗?为了探讨这个问题,本文特意请来了SQreamTechnologies的首席执行官AmiGal。他的观点是GPU数据库是未来的趋势。一起来看看他的理由吧!Ami拥有超过20年的技术和创业经验,拥有深厚的技术背景,曾在MagicSoftware(MGIC)担任业务发展副总裁,在高性能和复杂的数据集成环境中创造了新的增长引擎。他有这个想法的原因很简单:GPU读取和处理数据的速度比CPU快得多,每年的性能提升率在40%左右(相当于数据增长率)。目前,图形处理单元(GPU)的功能在深度学习、虚拟现实和自动驾驶汽车等几个核心领域之外的计算领域仍然相对未知。事实上,使用GPU进行非图形计算的想法对于大多数人来说也是闻所未闻的。不过,这种想法可以很快改变,从GPU数据库开始。很多人都知道GPU是比CPU更好的计算资源。当工程师和架构师意识到在屏幕上渲染复杂图像是一个可并行化的问题,即可以同时处理多个指令流的指令时,GPU应运而生,成为CPU的有效替代品。起初,解决问题的方法是创建一个新的处理单元,其中包含数千个不太复杂的内核以及速度更快、带宽更高的内核。单元比CPU强大得多。(现在你可能开始明白为什么数据库要用GPU了,毕竟GPU擅长数据的读取和处理。)其实GPU数据库已经发展的很好了!早在2016年,数据就以每年40%左右的速度增长,并且有明显的加速趋势。随着1TB存储智能手机的出现,企业处理的数据规模也上升到PB级,而CPU每年仅增长10%-20%,数据增长速度远超数据CPU可以处理的。这允许GPU数据库可用。起初,很多数据库行业的从业者并不看好GPU数据库,认为它只是一阵风,只适合那些小众领域,与内存数据结合使用。就在他们坚信未来仍将由传统数据库主导的时候,GPU数据库已经悄然被许多行业采用,包括一向对新技术接受度有限的政府部门。美国邮政服务就是一个很好的例子。他们的数据库管理着分布在200,000条投递路线上的1.54亿个地址。它还包括邮递员的位置数据。可以想象这个数据库的规模。使用GPU数据库,邮政服务可以快速处理复杂的查询,几乎与加载网页所需的时间一样长。此外,GPU数据库已广泛应用于金融、电信、零售、安防等行业。看看CPU和GPU今天可以处理的原始FLOPS:CPU-200gigaflops-每秒200亿次浮点运算GPU-120teraflops-每秒120万亿次浮点运算因为GPU可以同时处理许多计算,除法和征服。大问题被分解成小问题并立即解决。另一方面,基于CPU的数据库受其内核数量的限制,并针对运行序列化计算进行了优化。这导致数据库只能同时处理几个查询,并且必须一个接一个地查询。未来,很多人会开始看到GPU数据库革命性的强大能力。GPU数据库包含每个GPU的数千个核心。这允许数据库同时运行数千个查询并使用更高带宽的内存来启动。大多数企业都有投资回报率。虽然一个完整的GPU服务器可能很昂贵,但它可以与数十个甚至数百个传统CPU服务器的计算能力相媲美。GPU数据是如何实现的?大多数GPU数据库在云中运行,环境范围从IBMBluemix到亚马逊AWS。数据库构建完成后,您可以使用行业标准驱动程序使用标准SQL查询数据。驱动程序包括:JDBC和ODBCPython、Jupyter、sklearn等R和其他机器学习库。大多数GPU数据库的构建过程非常简单,不需要非常强大的技能,而且它们往往与现有的生态系统兼容。对于数据科学工作,工作量可能从几小时到几分钟,甚至更短。所有这些都为GPU数据库的开发创造了一个非常引人注目的案例,并将很快导致其广泛采用。