当前位置: 首页 > 科技观察

责任心缺失是数据中心故障频发的主要原因

时间:2023-03-18 19:52:30 科技观察

从昨天下午开始,不少傲游浏览器用户发现已经无法登录傲游服务器,无法使用在线收藏夹等功能。这起事件是因为21Vianet塘沽运营商的核心机房电缆正在维修,机房电缆被叉车切断。于是,傲游、豌豆荚、新浪邮箱、iCiBa,还有一些网络游戏上线了。服务同时中断。相关话题:机房突然停电,21Vianet你怎么了?针对此次事故,记者采访了多位业内人士。以下是施耐德电气旗下APC市场战略总监谢伟刚的采访实录。:为什么您认为中国的数据中心经常出现故障?数据中心建设过程中如何做到尽可能安全?谢伟刚:首先,国内数据中心在建设之初的规划缺乏整体性,数据中心的建设往往是“拍脑袋”开始的,可能导致相应参与者的需求模糊,缺乏责任心。其次,数据中心的建设还处于重基建、重设备、轻规划、疏管理阶段,实际规划、运营和管理经验不足。数据中心规划需要遵循以下步骤:第一步是根据业务需求确定相关的IT需求。这一步的完成输出五个重要的结果或参数:功率容量、预算范围、扩展计划、关键指标和整体效率,需要业务部门和IT经理的全面参与。第二步强调系统概念的开发,包括选址、参考设计选择和建筑布局设计。除了业务和IT参与外,这部分还需要设施基础设施管理人员的参与。第三步,确定用户的优先选择和约束条件,即确定场地条件的约束条件、项目管理和周期的约束条件、IT设备的约束条件。同时,确定数据中心必要的和可选的功能,包括什么,不包括什么?本部分除要求相应的管理人员参与外,还要求设施运营人员和IT实际运行运营人员参与。第四步,生成相应的系统指标描述文件,也就是我们通常所说的招标文件等文件。它通常是指系统设计时需要遵循的一系列规则。此步骤需要设施和IT操作员的参与。还需要项目主管的参与。第五步,根据规范制定详细的工程建设方案,包括生成详细设计,明确数据中心要安装什么样的物理设备,主要由设备/方案供应商和工程公司共同参与。每一步都会涉及相关参与者和责任人,尤其是在实际运营阶段,更需要物业、基础设施人员、数据中心运营商的密切配合,确保安全正常运行,避免事故的发生。:近年来,全球数据中心突发事故频发。你认为这是偶然的还是不可避免的?这是可以避免的吗?谢伟刚:单个事件的发生有其偶然因素。如果集中发生,那是必然的结果。例如,与数据中心相关的建设需要结合用户和设施的要求,避免类似的建设事故发生。数据中心选址时,要避开自然灾害频繁发生的地方,尽量选择电力资源充足、自然降温时间长的地方。为此,客户需要考虑各种因素,兼顾优势和局限性因素,实际参与者必须对建筑、楼宇、供电、制冷、自动化控制、IT和电力环境有了解。所以,数据中心的建设还是要看“风水”。:这样的事故会不会影响云计算的发展,用户还敢选择数据中心提供的云服务吗?谢伟刚:云计算是一种商业模式的变革,是整个IT行业发展的必然趋势。云计算在早期会面临很多挑战。但是,它带来的便利性、灵活性和整体效率要大得多。它远远大于我们现在看到的一些缺点。随着各项技术的不断成熟和经验的积累,相信这些弊端会得到有效的治愈。因此,建议用户不要过于担心。