导致Oracle企业绩效管理系统宕机的原因有很多。有效应对OracleEPM系统宕机,需要掌握哪些预防技巧?企业日益扩大企业绩效管理系统(EPM)的部署规模,以获得更广泛的用户群。EPM应用程序可以帮助他们在整个企业内共享财务信息,并提供对业务成果的全面分析,而不仅仅是在财务部门内部。使这些系统对企业比以往任何时候都更加重要。本文将讨论OracleEPM系统如何实现高可用性和容错,以及如何防止停机。而一旦出现宕机,如何有效缩短宕机时间,快速完成系统从宕机中恢复。要构建高可用性EPM系统,您首先需要建立所需的服务级别。这个过程包括检查和评估不同类型故障发生的概率,以及评估业务系统对这些故障导致的停机和数据丢失的容忍度。填写如下所示的简单表格可以帮助您记录业务系统的EPM服务级别要求。例如,您可以创建一个如下图所示的表,其中包含两个针对特定故障的服务级别指标:一个是恢复点目标(RPO),它指定了可以容忍数据丢失的最长时间,以及另一个是恢复时间目标(RTO),它是恢复数据所需时间的量化指标。示例OracleEPM系统服务级别要求量化表现在让我们看一下一些常见的故障类型以及处理这些故障所需的步骤,以避免或最大限度地减少它们对OracleEPM系统的影响,以便系统可以达到您所需的服务级别。数据损坏。大多数EPM系统故障都是由于人为错误造成的,这意味着数据损坏是最常见的故障类型。定期的数据备份可以解决数据损坏的问题。Hyperion的产品线是OracleEPM套件的基石。Hyperion的生命周期管理工具可以编写脚本来定期备份安全设置、应用程序、数据、报告和其他EPM组件。脚本需要人工维护和监控,因为它们可能需要不断调整以适应应用程序的不断变化。备份EPM服务器本身以防止操作系统层损坏也很重要。此外,还备份关系数据库存储以防止损坏问题。时机也很重要。数据库、操作系统和文件系统需要在同一时间点恢复。您需要为恢复计划协调系统、数据库和Hyperion安全程序,以确保平台一致性。硬件故障。服务器硬件故障通常不常见,但并非不可能。应对硬件故障导致的系统宕机,常见的策略是使用服务器集群,当系统出现故障时,可以完成相应的业务处理。有两种不同类型的集群:主动-主动集群和主动-被动集群。在主动-主动集群中,服务器被配置为在多个服务器之间分配工作负载,所有这些服务器同时运行相同的服务。这样做的目的是为了实现负载均衡。通常,物理负载平衡器充当集群的单一入口点,它负责在服务器之间分配处理资源的请求。如果一台服务器出现故障,其余节点将继续正常运行。活动-活动集群通常用于OracleEPM产品的网络层。但是,在某些情况下,OracleEPMSuite不支持多个主动-主动负载平衡组件。在这些情况下,需要主动-被动集群。在主动-被动集群中,一次只有一台服务器在处理服务。如果发生故障,备份服务器会检测到故障,启动处理服务,恢复系统运行。Active-passive集群在EPM系统的数据层非常常见,类似于用于支持Hyperion部署的Essbase多维数据库。数据中心故障。借助当今可用的技术,有许多方法可以防止数据中心的整体故障。一种方法通常是将EPM产品生命周期管理导出到另一个数据中心灾难恢复实例。这个过程可能很复杂,需要大量的脚本编写、自动化和维护,但对于没有昂贵的数据复制技术但对停机时间有严格要求的用户来说很常见。对于那些对宕机时间有严格要求的用户,可以使用复制软件来实现两个数据中心之间的系统同步。这意味着在数据中心发生故障时几乎不会丢失数据。但它的缺点是复制软件的成本高得令人望而却步。通过质量保证在故障发生之前预防故障是处理停机时间的最佳方法。必须建立严格的质量控制体系。对于开发人员、测试人员等EPM项目参与者,应根据其相应的安全访问权限制定明确的角色和责任体系。质量控制还提供了在产品投入使用前对其进行适当测试的框架。此外,质量控制还将建立相应的工作流程、审批、审计跟踪、退出程序、通过/失败等质量保证流程。正确管理和维护Hyperion也非常重要。与任何其他系统一样,一些周期性任务需要每天、每周和每月完成,以便对OracleEPM系统进行适当的调整。这些任务包括日志轮转。文件系统清理、系统健康监控、容灾测试和性能监控等EPM系统监控和安全当然,世界上所有的准备和预防过程都不能完全消除故障。但是您需要为这些突发事件做好准备,并确保您制定了应急计划来检测故障并快速做出反应。问题检测是最大限度减少停机时间的关键。有许多商业和免费软件可用于监视EPM系统运行状况。这些软件包可以检测故障并通知相关人员立即修复它们,有时甚至在用户意识到问题之前。此外,还可以为相应的事件设置告警,在这些事件真正造成破坏之前发出预警信息。一般需要设置告警的事件包括响应时间慢、磁盘空间不足、部分业务系统日志错误、CPU或内存占用率过高等。毋庸置疑,安全是每个行业CIO的首要任务。OracleEPM系统通常用于保存敏感和机密的财务数据。系统的每个级别都需要有安全流程和安全工具。这些过程包括密码强度和密码轮换策略、操作系统加固、网络防火墙、隔离级别、连续入侵检测和数据加密,所有这些在数据传输期间和系统空闲时都会持续进行。这些听起来可能很复杂,但这些措施对您来说是有代价的。但如果什么都不做,付出的代价将更加难以估量。在大多数情况下,保护相关业务数据、硬件和数据中心设施的成本明显低于因EPM系统故障和数据丢失给企业带来的损失。无所事事的成本对企业来说是非常昂贵的
