中国电力设备管理协会

首页>专业论文

创新信息设备管理 强化设备运行效能

作者:中国能源建设集团安徽电力建设第一工程有限公司   发布时间:2016-05-03

       中国能源建设集团安徽电力建设第一工程有限公司(以下简称公司)成立于1952年,是中国能源建设集团骨干企业。公司同时拥有电力、房建、市政公用工程施工总承包一级和发电工程类甲级调试资质,具备对外承包工程和进出口经营资格,是国家AAAA级标准化良好行为企业和中国建筑业成长性百强企业。公司承建项目遍布海外12个国家和国内24个省、市、自治区,是我国承建项目跨地域最广、经营规模最大的电力工程企业之一。公司致力于成为具有国际竞争力的管理技术型工程承包商。公司承揽的工程项目点多面广,各项目部与公司沟通的主要工具和渠道就是公司IT设备和信息系统。自2000年以来公司已建设10余个管理信息系统,这些系统的稳定运行对硬件设备的要求越来越高,需要持续升级硬件设施。
       一、实施背景
       信息系统在多年运行过程中经常存在宕机,访问人员增多时系统效率下降等问题,经分析主要原因如下:
       1.机房设备老化,很多设备使用时间超过4年以上,设备能耗大,运行稳定性差。
       2.机型及配置参差不齐,标准不统一,管理不集中。
       3.机房环境差。机房温湿度控制不力,设备物理防护不足。
       4.设备运行维护费用高。设备发生故障停机时造成业务活动中断,给公司经营管理活动带来严重损失。
       5.设备管理存在差距。公司信息设备数量多,调配部署变动快,原有管理方式不能满足实际管理需要,必须投入更多的资金和资源建立设备管理信息系统,以提高设备管理水平。
       6.设备正常运行需要大量的能源、资源消耗,以及设备的日常维修保养消耗。
       7.项目部视频设备常常掉线,存在画面不清晰、信号效果差等现象。
       针对上述存在的问题,公司科学决策,实施全方位治理措施,以彻底改变原有被动局面,大力提高设备的完好率和使用效能。
       (1)工作思路。统筹规划升级公司信息机房、网络、视频会议系统。建立健全设备管理标准制度,强化设备日常管理和“首问负责制”,应用信息技术提升设备管理水平,规范设备管理流程,使设备管理人员、使用人员、维护人员通过信息系统有效沟通,统一管理模式和平台,实现精细化管理,强化设备运行效能,便于公司集中管控。
       (2)预期目标。通过分析信息系统数据报表,针对性地做好设备运维、调配、维护、报废工作,达到提高设备可靠性和可利用率,控制维修成本,延长设备使用寿命,降低备件库存及备件成本,减少设备停机时间等管理目标。力争设备累计故障时间降低10%左右,不发生设备故障导致的网络瘫痪,设备软硬件维护用户满意度达98%以上。  
       二、内涵与主要做法
       1.规范设计统筹规划。
       依据节能环保、管理信息化、统筹规划的原则实施顶层设计,建设符合C级标准的信息机房以及网络、视频会议系统。公司原有设备30台塔式机,经系统分析和广泛调研,现在使用虚拟机技术加以整合,采购10台机架式服务器,部分设备使用刀片式服务器,服务器数量减少,空间节省,达到节能降耗的目标。公司网络设计成三层结构,综合布线按接入层、汇聚层和核心层结构化布置,骨干网络采用万兆光纤。网络出口采用电信、联通各100M双路通道,提供双线路由同时保障故障容灾。
       2.建立健全制度体系。
       建立健全管理制度,落实人员职责。一方面公司总部建立信息机房管理制度、门禁管理制度、设备运行管理制度、安全管理制度、网络控制策略等企业标准,从组织上、制度上规范机房物理安全、出入管理、设备和系统巡检、操作票管理等,定期对管理标准实施有效性评价,达到管理标准化。另一方面建立项目信息化管理工作指南,规范项目部网络和视频会议系统建设。由公司专业网络工程师统一管理和维护网络访问控制策略,避免由于众多项目部信息管理员参与管理及其专业性不强导致设备运行维护故障。统一规范项目部网络设备接入,包括设备和系统口令管理、防病毒管理、补丁系统管理等,规定网络违规行为和违规处理,按月实施设备运行情况考核通报,保证各项目信息设备的安全稳定运行,有效支撑资源配置、项目异地复制等工作的开展。
       3.强化设备日常管理。设备日常管理主要包括机房出入管理、集中管理、应急管理等。
       出入管理。安装门禁,凭卡出入,系统自动记录出入人员信息,无卡人员一律不得进入。并有监控系统对出入实施远程监控。
       集中管理。公司层面,专职人员每日集中巡检并作记录,出现异常报警及时处理。对设备的操作统一在操作间进行,操作前须办理操作票,通过KVM切换访问设备。查看事件处理的时长,催办时长超过一定限度的事件。项目层面,防火墙、视频终端等核心网络设备实施集约化管理,由公司专职人员统一实施管理操作。
       应急管理。依据应急管理制度编制应急预案,每年实施设备应急演练,熟练掌握灾难恢复技术,通过演练和日常巡查,系统设备采用单机RAD5+数据备份,取代双机热备方案,在保障系统运行可靠性的基础上,节省了采用双机热备的成本,减少大量投入。
       4.应用信息技术提升设备管理水平。
       (1)固定资产管理系统。
       为实现资源合理配置,提升设备管理能力,提高工作效率,解决信息设备管理和调配中存在的问题,支持科学决策,公司自主开发“固定资产管理信息系统”。系统采用BS架构等信息技术开发。科技信息部在发生信息设备购置需求时登记固定资产采购申请,在设备购置后填写固定资产付款申请并报批,审批通过后维护固定资产入帐时间,并自动形成固定资产台帐,当信息设备需要调配时,填写相应设备领用调配单并报批,当资产发生报废时填报资产报废申请单,完成相应固定资产的报废。使用该系统可实现对信息设备的采购、入帐、维护、调配、报废全过程管理。信息变动调配更加及时准确,资产处理记录透明公开,信息设备的全生命周期信息实现共享,公司固定资产管理更加高效便捷。

       (2)运维管理系统。
       针对信息设备运行管理,公司设计开发符合自身特色的信息设备运维管理系统,规范信息设备的运维操作,保证设备能够被有效利用和在运行过程中处于良好状态。运维关键业务需经流程审批才能实施操作,对服务器、终端机、工作站、便携机、系统和网络等设备的运维进行标准化管理。制定操作规程规范关键设备的启动/停止、加电/断电等操作。系统实时监控防火墙、交换机等信息设备,监测其性能参数,及时发现问题并进行报警,根据报警类型提供处理建议。通过运维管理系统有效运行,保障各类设备运维活动可控在控,杜绝信息设备意外停机。

       (3)系统统计分析。
       固定资产管理和运维管理系统从两个维度生成信息设备相关数据,并且相互关联融合成有机统一体,通过对这些数据的统计分析可以辅助设备管理决策,有效杜绝不合理采购和不必要设备采购费用,降低管理和运维成本。
       1)信息设备各年度实际投入查询统计:可以按设备类别、使用单位部门、采购日期、设备状况等分类、分时间段统计查询比较,并导出设备信息统计报表。
       2)根据设备日常管理和决策支持的需要,系统还提供入账资产查询,采购申请查询、资产调拨查询、资产状态统计、资产原值分类统计、资产月折旧统计等功能。
       3)系统运行状况分析。对运行状态不正常的系统,可以追溯当前有哪些异常事件,如端口/链路、硬盘空间、内存等。可对服务器等设备各类参数、故障类型统计分析,知道最主要的设备瓶颈具体是在哪台设备哪个性能指标。
       三、实施效果
       1.取得显著经济效益。
       通过集约化使设备数量减少,达到节能减排的效果,降低能耗,节约成本。通过使用体积更小的机架式设备,服务器、电池组集合到几个机柜中,信息设备日耗电减少12%,通过上线资产和运维管理信息系统,设备调配维修流程顺畅,事务处理时间显著缩短,用户满意度大幅提高。公司在采购、调配、运行、维修保养等过程中节约费用折算约26万元/年。
       2.提升设备运行效能。
       通过规范管理过程,统一设备选型,设备维护人员减少,系统稳定性提升,设备宕机率大幅减少。维护人员由原来10人减少到4人,信息系统年平均故障时间由原先的16小时减小到现在的4小时。
       3.设备管理全员参与形成常态。
       每月对信息设备采购成本、停机时间、故障率、故障次数及类型、设备维保等各种基础数据进行统计和收集,每日对设备做巡检,及时安装系统补丁,确保最佳工作状态。建立全部设备的系统备份库,确保系统的灾难恢复。健全信息设备履历表,通过记录设备的典型故障及维修过程,有效统计设备平均无故障时间。针对故障率高的设备,制定重点检查的项目及内容。设备年度完好率已达到100%,设备平均故障停机率仅为0.5%。(主创人员:李传玉、都五七、叶明宏、王大明、周  伟、易  娜)