当前位置: 首页 > 科技观察

金融数据分析应用四大难关南大GM携手英特尔夯实数字化转型基石

时间:2023-03-21 11:05:03 科技观察

大数据时代,行业数据存储一直是企业数字化转型过程中的首要考虑.随着人工智能和物联网技术的快速发展和云的广泛应用,企业越来越重视基础设施能力建设。数据库是互联网时代企业早期应用的核心。当数据洪流袭来,数据应用渗透到技术、业务等各个层面时,企业在数据存储和分析方面也面临着一些新的挑战。特别是对于金融行业的数据存储问题,业务的增长和扩张往往伴随着海量结构化数据的处理,加之金融行业对数据存储在安全性、效率、合规性等方面的要求,传统数据库已经难以满足金融业的业务发展需要。目前,国内大数据领域发展迅猛,国产数据库的崛起成为必然趋势。在这样的背景下,台大通用自主研发的GBase8a脱颖而出。是一种大型分布式并行处理(MPP)数据库集群系统,面向海量数据查询和分析应用,能够满足结构化数据存储、分析、挖掘、备份等多种需求,有效支撑金融业的业务扩张需求。为了加强GBase8a的能力,台大与Intel合作,采用Intel?Xeon?Scalable处理器作为产品核心,并在Intel推出全新数据中心平台后更新产品,进一步提升GBase的性能8a.#videoid{height:350px}@media(max-width:767px){#videoid{height:186px}}@media(max-width:320px){#videoid{height:186px}}金融数据存储的四大难点数据产业正在逐渐成熟。一方面是国家政府的大力支持。另一方面,在技术创新的趋势下,各种新应用带来的数据量爆炸式增长,改变了商业模式,促使大数据产业进入新阶段。金融行业由于其特殊的行业属性,在发展过程中将面临结构化数据的快速增长。目前,在日益复杂的业务环境和数据增长的背景下,数据库在金融行业的应用主要面临以下四大难点:一是数据多样化和快速爆发,数据分析和吞吐量瓶颈。在金融行业的创新业务中,数据来源多种多样,数据在存储前需要进行整合分析。而且,数据集规模将达到数TB甚至数十PB级别,并发用户数远超传统业务的承载能力,对数据库的吞吐能力提出严峻挑战。二是TCO快速上升。快速扩展的数据库系统带来了对云和数据中心基础设施的强劲需求,推高了总体拥有成本(TCO)。企业用户不断寻求通过硬件更新、软件优化等方式提升单节点服务器的性能,从而提高投资回报;三是数据存储IO效率低,难以支持企业内部协同。在数字化时代,企业各业务部门之间的协作更为重要。对于企业的关键业务,更高的处理效率和更低的延迟是核心,这对数据库IO操作的效率和服务质量提出了新的要求。;第四是数据安全,这是金融行业非常关注的问题。数据就是价值。企业用户在选择数据库时,不仅要考虑性能和延迟等因素,还要评估数据存储的安全性和容灾能力,尤其是在对业务进行数据分析时对数据权限的控制。台大通用分析数据管理系统GBase8a系统架构台大通用是一家专注于国产数据库研发和推广的国内数据库公司。针对大数据时代企业数据的有效管理,台大总务自主研发了GBase8a、GBase8s、GBase8c等数据库产品。GBase8a是一个大规模分布式并行处理(MPP)数据库集群系统。与传统数据库相比,GBase8a在处理结构化数据方面优势突出,支持从几TB到几十PB的数据集。从研发、应用到成熟,GBase8a经历了漫长的沉淀。2014年,国内某银行总行大数据平台项目启动。面对每天TB级的数据增量,数据库操作复杂,日运行时间长,数据来源多样,NTUGM与其合作,整合GBase数据库,成长为能够支撑如此高强度工业的世界级数据库应用:部署近2000个节点,管理数据超过25PB,运行2000多天无故障(案例参考:http://www.gbase.cn/case_info/1188.html)。目前,GBase8a已在人民银行、银保监会、证监会、农业银行总行、中国银行等金融领域进行大规模应用部署、中国工商银行、招商银行。企业等多领域延伸。尤其是在电信行业,在中国移动总部和30个省市进行了大规模部署。目前,GBase8a数据库已在全球34个国家部署了30000多个节点,管理着超过200PB的数据(数据参考:http://www.gbase.cn/casee/377.html)。NTUGM携手Intel:让数据迸发新价值多年的磨练造就了NTUGMGBase8a的出色性能。在中国信息通信研究院第十二批大数据产品能力库基础能力评估会上,NTUGeneralGBase8a通过中国信息通信研究院大数据产品大规模能力基础能力评估满分4096节点。信通院大数据产品大规模能力基础能力通过最大MPP数据库集群测评。这一成绩在国际市场上也具有很强的竞争力。这也让台大通用成为国内第一家完成4096节点规模专项性能测评的数据库厂商。这主要得益于GBase8a强大的可扩展性。GBase8a的每台服务器都使用本地资源,基于点对点的扁平化架构,大大增强了GBase8a的水平扩展能力。同时,集群的计算性能和存储容量可以随着集群的扩展而线性增长。GBase8a还拥有全新列存储引擎、高数据存储压缩比、免维护粗粒度索引、多实例部署等多项大数据处理技术。在MPP高效的分布式计算模式下,结合分布式智能优化器,GBase8a可以完成对PB级结构化数据分析应用的支持。不仅如此,GBase8a还可以通过集群内部副本同步技术、双集群技术、跨域集群数据传输同步技术和虚拟集群技术,保证大数据和多集群支持下集群的高可用,并实现部署多个数据中心。在行业应用市场,GBase8a植根于大数据分析应用,主要服务于电信、金融、能源等大型企业。2019年,台大通用与英特尔合作,入选英特尔精选解决方案,可帮助数据密集型行业用户提升数据分析性能,显着降低应用响应时间。CPU是数据库系统整体性能的核心。基于GBase8a的IntelSelectSolution可以充分发挥IntelXeonScalableProcessor的性能优势。随着第三代Intel?Xeon?ScalableProcessor的推出,经过程序升级,GBase8a性能再次提升,业务运行效率也随之提升。第三代英特尔?至强?可扩展处理器在性能和功能上有了很大的提升。具体来说,主要有三点:1.对于数据库应用,最新的第三代英特尔?至强?可扩展处理器微架构和核心数量的增加是推动数据库性能增长的关键,可以有助于加速IO密集型负载的处理,在相同服务器数量的前提下实现性能的大幅提升;2、第三代英特尔?至强?可扩展处理器在8路配置中提供多路核心数密度,每个处理器最多40个核心,性能、吞吐量和CPU频率都有显着提升,平均性能主流数据中心工作负载增加46%。3.第三代英特尔?至强?可扩展处理器增加了几个新的和增强的平台功能,这些功能针对云、人工智能、高性能计算、网络、安全和物联网工作负载进行了优化。对于主流的机器学习和深度学习工作负载,第三代英特尔?至强?可扩展处理器可以带来比其他CPU高出1.5倍的性能提升。并且增加了PCIe-Gen4支持,增加了内存带宽,每个处理器内存容量为6TB,并增加了AVX-512指令。在这些能力的加持下,GBase8a拥有无缝的性能基础,也有助于加速多云、智能边缘和后端数据的转型影响(复制链接了解最新合作:https://bizwebcast.intel.cn/eventStart.aspx?eid=257)。加速万物云化,夯实IT基础随着企业业务的不断发展,未来各行各业都将面临云化趋势。从数据类型来看,一般分为三类,结构化数据、半结构化数据和非结构化数据。结构化数据是一种格式整齐的数据,通常可以用统一的结构来表达所实现的数据。传统行业有大量的结构化数据。相比之下,非结构化数据不易组织或统一。具有可变字段的数据。在数字时代,网络大数据大多以非结构化数据的形式存在。企业发展产生的数据中,80%是非结构化数据,并且每年都在快速增长;半结构化数据是介于全结构化数据和完全非结构化数据之间的数据,具有一定的结构,但变化很大。比如企业中的各种日志信息,就属于半结构化数据。不同的数据类型自然需要不同类型的数据库来存储。虽然非结构化数据是当前数字时代的主要形态,但结构化数据在各行业长期的业务发展过程中大量积累。而新的业务发展也会对数据存储环境产生变化,因此数据库的变化也随之而来。同样在这种趋势下,英特尔推出了第三代至强?可扩展处理器,这是一个新的数据中心平台,可以针对在本地和分布式多云环境中运行的现代工作负载进行优化,并与英特尔?傲腾?持久内存和存储产品组合相结合、以太网适配器等解决方案可以为数据库带来更强的性能。值得一提的是,英特尔?傲腾?持久内存有两种运行模式——内存模式和AppDirect模式,可以通过多种方式提升数据库性能。Intel?Optane?持久内存的内存模式可用于降低缓存层的成本,而AppDirect模式提供高速大容量数据存储能力,提高数据库中的读写速度优化数据存储。在实际产品应用中,OptaneSSDP5800X/P5801X的组合可以提升单台服务器的扩展性,实现数据库加速、写缓存、高性能分层等功能,让用户部署数据集更加方便。未来企业发展将与存储和计算分离,结构化、半结构化、非结构化等结构化数据并存。借助Intel在核心性能、硬件组合和软件优化方面的支持,NTUGeneralGBase8a革新传统业务结构化数据存储,不断提升数据库性能,为企业用户数字化转型打下坚实基础。随着大数据产业的演进,新的数据库解决方案将应用于越来越多的行业,推动数字经济建设。点击下方链接获取解决方案白皮书!NTUGeneral使用第三代英特尔?至强?可扩展处理器提升其GBase8a性能(intel.cn)