当前位置: 首页 > 科技观察

偶科技构建新一代数据仓库,更适合AI应用场景

时间:2023-03-13 02:31:30 科技观察

【.com原稿】当今信息社会充斥着各种信息资源。如何有效地管理和利用各种信息资源,是科学研究和决策管理的前提,而数据处理是管理信息系统必不可少的核心部分。从人工管理阶段到文件系统阶段再到现在的数据库系统阶段,近几十年来数据处理发生了质的飞跃。偶数科技CEO常雷在近期接受采访时表示,新一代数据库应该对应AI大脑的层次,更适合人工智能应用场景。于是,偶数科技抓住了这个机会,开始研发基于HAWQ的第四代数据仓库,并获得红点、红杉领投的天使轮和A轮两轮融资。数据库的演进在谈新一代数据库之前,我们先来看看数据库的演进。数据库系统从研发到现在,已经走过了几十年,从第一代共享存储数据库,第二代MPP数据库,到第三代存储计算分离架构数据库经历了三个演变。·共享存储数据库,为了节省资源,降低开发者成本,出现了共享存储数据库,数据存储在高端的共享存储中。传统的Oracle数据库是共享存储数据库,也是最早的事务型数据库。这类数据库的存储在节点较多时会成为瓶颈。·MPP类型的数据库目前被大量公司使用,包括Teradata和Vertica。由于操作系统、文件系统等底层基础还不是很成熟,Teradata采用专有硬件,注重软硬件集成,更改了大量的操作系统和文件系统代码。2000年左右出现了基于x86架构的MPP数据库,包括Vertica、Greenplum等。这些基于x86架构的MPP数据库使用的是普通服务器,没有专有硬件支持,软件架构仍然类似于Teradata。·存储和计算分离架构的数据库,这类数据库的典型代表有HAWQ和Hive。第三代数据仓库的优点是扩展性好,但Hive等大部分引擎性能较差,兼容性差,客户难以使用。在人工智能背景下,基于HAWQ的新一代分析型数据库常雷表示,在1990年代左右,数据处理不仅仅局限于存储和管理数据,而是着眼于用户需要的各种数据处理方式。分析数据库是面向分析应用的数据库。它可以对数据进行在线统计、在线分析、随机查询,以发现信息和数据的价值。在处理海量数据方面具有一定的优势。但在人工智能场景下,大部分分析型数据库还是有些难度,迭代创新迫在眉睫。偶数科技打造的基于HAWQ的欧数数据库,在为人工智能处理海量数据方面具有得天独厚的优势。新一代分析型数据库解决不同领域的数据处理瓶颈随着大数据和人工智能应用的出现,对新一代数据库的海量数据处理和分析能力提出了更高的要求。金融、安防、制造等,各行各业对数据库性能的提升都有非常迫切的需求。新一代分析型数据库的诞生解决了这一需求。在人工智能的应用场景中,比如安防领域,新一代数据库可以通过图像识别、人脸识别进行更深层次的认知和推理;、电子车牌等不同类型的数据进行分析、碰撞,发现潜在联系,提取有价值的信息,对可疑行为进行预警,关联案件,助力公安部门提高破案效率。针对实时数据等实际案例,比如企业的实时物联网传感器数据,新一代数据库摒弃了繁琐的Storm等解决方案,解决了大量编程无法完全适配物联网传感器的问题数据。问题。此外,下一代数据仓库还解决了全球规模部署的需求。如今,任何核心应用都离不开数据分析和人工智能,比如传统银行的交易系统、信用卡的反欺诈系统。在实现两地、三中心、异地多活动的数据仓库方面,管理PB级数据的数据仓库系统是一个很大的挑战。新一代分析型数据库的应用场景常磊认为,当前数据库应用需求发生了巨大的变化,恰恰说明数据库市场将迎来巨大的变革机遇。偶数科技在这个转折点上推出了欧数数据库和LittleBoy这两款核心产品。OushuDatabase基于ApacheHAWQ,LittleBoy是一款与OushuDatabase无缝集成的人工智能产品。可应用于金融领域、税务数据、公安数据、电网数据等大数据领域。在金融领域,涉及企业向银行借款的传统业务。银行首先要对企业进行尽职调查和审查,然后通过评审委员会的评审。这些审查过程需要人工操作;如果涉及个人贷款和小微企业贷款,可以自动审核借款人信息,因为借款人信息比较容易获取;如果涉及到公司业务,就会涉及到庞大而复杂的数据,银行需要收集所有内部和外部的数据。然后先根据主题整合内部数据,再整合外部数据集。EvenTechnology通过数据存储、管理、分析和人工智能算法建模,帮助客户轻松构建模型流程和模型管理上线,免去以往繁复的审核流程,大大缩短审核时间。采访中,常磊表示:“微软加速器对偶数科技的帮助很大。一方面,微软加速器与偶数科技在研发方面达成了一些合作,偶数科技已经将产品移植到微软加速器的Azure公有云中。”;另一方面,微软加速器引入了很多来自不同行业的客户资源,管理、财务、招聘、公关等方面的培训也对偶数科技进行了指导。”