当前位置: 首页 > 科技观察

G线文件传输架构设计及运维管理

时间:2023-03-17 00:02:32 科技观察

随着银行信息化的快速发展,应用系统的数量逐渐增多,系统间的数据文件传输需求呈指数级增长,由此产生的问题很多,使得日常的运维和管理工作变得更加复杂。问题一:业务系统之间的文件传输和交换相互独立,形成复杂的传输关系。当异常发生时,很难定位问题的根源和关联的影响;独立开发,没有统一标准,后期维护困难;问题三:同一个文件被多次提取发送,数据共享性差,系统间文件传输流量无法复用或合并,增加网域重复流量;问题四:全行传输业务缺乏统一视图,全行传输业务没有统一的管理方法,无法实时监控全行文件传输情况。G行文件传输系统作为基础支撑系统,对数据文件传输进行统一规划,为全行所有应用系统提供数据文件传输服务接口,建立全行统一的传输接口规范和标准,确保全行文件数据传输过程的顺畅。易管理、高效、可靠,满足GBank业务发展和应用系统间文件传输交互的需求。1、架构设计G行文件传输系统采用节点网状部署、信息集中管理的设计。节点分布在需要进行文件传输的应用服务器上,每个节点都可以连接到同一网络域中的其他节点。部署设计可靠性高。每两个节点之间的传输不受其他节点和管理终端的影响。如果发送节点服务运行正常,则可以按照预设任务发送文件,接收节点服务可以正常接收。这些文件存储在约定的目录中。可以通过中心节点转发文件共享或跨域文件传输。中心节点采用集群模式,支持自动路由和负载均衡。具体传输链路如图1所示。图1传输链路示意图文件传输系统分为三层业务架构:接入层、管理层和平台层。接入层负责与全行应用系统对接,根据本地存储的任务信息对文件进行处理和传输。管理层负责节点和任务信息的管理,实时同步信息到接入层和平台层,平台层负责文件分发、传输扩展和数据存储,如图2所示。图2三层业务架构2.运维管理一般系统管理员的主要工作是处理系统中需要人工干预的各种事件,以及来自开发的变更需求,确保系统提供稳定的服务对外提供服务。但是,随着G行文件传输系统的节点越来越大,每天传输的文件数量越来越多,相关的事件和变更需求也越来越多。根据传统模型,管理员很难处理越来越多的事件。.因此,G行文件传输系统配备管理模块,解决运维难题,替代人工操作,减轻管理员压力。管理模块的定位是保证生产的稳定有序运行。通过设计和构建自动化工具来发现、解决和降低风险,主要包括以下三个方面:监控策略:监控管理功能是监控全行文件传输服务可用性的一部分。主要手段。文件传输系统主要从传输节点和传输任务两个维度进行监控:传输节点启动时,会主动与管理端建立连接,管理端维护连接信息,每隔一段时间进行一次检测30秒,连续5次检测失败报警;同时将传输节点的运行信息实时上报给管理端,发现异常时发出告警。传输任务的监控是为每个传输任务设置时间阈值。当传输异常或超时文件传输未完成时,会发出告警。对于多次传输和重复传输的情况,管理端也会进行判断,并根据设置直接终止传输和告警。监控管理一直是持续优化的重点工作。未来将不再依赖人工分析告警信息,直接由系统自动分析。只有当需要人来执行某项操作时,才会通知管理员。紧急响应:任何需要人工干预的事情只会延长恢复时间。一个即使发生更多故障也能自动恢复的系统比一个凡事都需要人为干预的系统更可用。G行文件传输系统具有服务异常、文件传输异常时自动恢复的能力。当发现进程异常终止时,系统会立即重启,以免影响文件传输。同时收集相关记录,用于调试和事后分析。在文件传输异常的情况下,采用自动重传或恢复模式,保证文件传输能够及时恢复。如果文件生成时间晚于预定发送时间或数据错误修正后需要重新发送,此时无法避免人工干预,可以使用紧急重传功能重新发起任务,系统会根据任务信息重传文件。变更管理:过去的经验告诉我们,大多数生产事件都是由变更触发的。G行文件传输系统的变更管理功能,实现传输任务自动在线生产,生产状态实时跟踪,出现问题时安全快速回滚。这样就可以排除人为因素,操作不再受人经常出现的经验误差和大量重复劳动带来的疲劳的影响。有效提高变更的执行速度,降低变更带来的风险。具体实现是管理端通过流程系统获取变更文件,导入完成后自动推送变更信息到各节点。无需重启应用,新增和调整的传输任务实时生效,保证文件传输的连续性。管理模块的另一个定位是提高运维效率。通过区分用户权限,开通查询和配置功能,在实现安全控制的同时,为用户提供便捷的服务:用户管理:用户管理功能将用户分为超级管理员、管理员、操作员三个级别,具有不同的访问权限,也可以分配某个用户可以管理的节点,避免在权限范围外误操作节点。结合G行实际场景,为一线运维人员分配操作员权限,可以查询全行节点和传输任务信息,传输异常时具有应急处理权限;二线运维人员被赋予管理员权限,可以查询和更改自己负责的节点任务和任务的信息配置和监控设置;文件传输系统运维人员拥有超级管理员权限,对全行文件传输进行统筹管控。传输查询:传输查询功能包括节点查询、任务查询和明细查询。节点查询可查询全行节点地址、端口号、状态及配置,方便运维人员实时获取节点运行状态;任务查询可以通过文件名、发送或接收节点等条件查询任务信息,包括发送时间、发送目录、接收目录、文件生成,运维人员可以通过任务查询掌握系统间的传输关系;明细查询用于显示每条传输记录的发送和接收节点、传输时间、文件大小、是否成功等,使用明细查询运维人员可以确认每个任务的传输结果。操作日志:操作日志功能可以直接查看全行各节点的日志信息。当节点异常或传输任务异常时,无需登录应用服务器,可直接通过管理控制台分析日志,提高了运维人员排查问题的效率。G行文件传输系统大大提升了文件传输运维管理效率。但是随着业务的发展,文件传输的场景和数量会越来越多,文件传输管理的难度也会进一步增加。我们需要不断迭代,不断创新,逐步推动智能运维管理的全面实现。3.总结文件传输管理工作的基础和重要性。G行文件传输系统的构建充分融合了多种传输模式,梳理了文件处理流程,实现了文件传输的标准化、统一化管理,使应用系统能够更好的专注于业务逻辑的构建,提升处理能力系统能力,增强应用系统对业务的支撑能力,有利于业务的灵活发展。未来随着银行科技的不断发展,G行的应用系统全上云,文件传输需要完成节点负载均衡架构和文件分布式存储的改造,以满足应用迁移后的文件传输需求到云端。这也是文件传输系统的未来。发展目标是覆盖全行文件传输场景,不断提升管理效率,持续为全行业务提供可靠的文件传输服务。