豪越HYDO教育行业运维监控案例(高校)
作者:互联网
随着IT信息化不断发展,云计算、大数据、人工智能等应用规模不断扩大,教育行业互联网建设成为重中之重,系统网络化的建设需求,信息共享、多级管理、设备监控成为信息化管理部门迫切需要解决的问题。
建设运维监控管理平台,是确保IT系统高可用性、提高运维管理水平的重要保障。为了确保系统可靠、高效运行,为业务使用人员提供更高、更快的服务质量,需要建设一套一体化智能运维大数据管理平台,对机房中动力环境、IT基础设施、IT硬件设备、IT基础软件等进行全面监控、信息统计与分析,实现风险、故障的早预警、早定位和早处置。该系统要具有很高的实时性、有效性和分布式扩展功能,能够具有常年提供7*24小时监控和报警通知的能力。
目前,国内许多高校的IT运维部门也都有从传统的、零散孤立的网络软硬件维护上升到基于业务的IT运维服务管理层面的需求。高校做为一个特别的群体,具有网络设备的种类、数量多、网络环境复杂、业务系统应用广泛、涉及的品牌繁杂、部分服务群体流动性高等特点。
因此,国内某大学迫切需要一套可行的自动运维监控系统,从而支持业务系统并提高网络资源的运维效率,实现对整个网络的透明化管理,确保整个网络的服务质量,减少混合网络管理环境下的管理和控制网络运营成本。全新的自动运维监控系统,需要具有强大的扩展性、知识库、巡检管理等全新功能,通过全新的自动运维系统,最终实现IT服务管理的最佳化和流程化提供坚实的基础。
建设目标
该大学希望通过引进全程精细化管理项目方案,获得以下重大效益:
实现对多品牌、多平台、多类型IT设备及业务资源的集中统一管理,IT系统全面、多样化的灵活管理,使IT维护人员实现轻松管理。
具有灵活的、清晰的、高效报警策略,报警阈值和级别可灵活设置,便于故障的准确定位。
在出现告警时,告警消息秒级发送,通过多种方式迅速通知相关人员,保证对故障的快速定位与恢复,避免造成损失的扩大。
通过自动巡检、定时报表、运维流程管控等功能,可极大的减轻运维人员的工作负担。
自身收益:使该大学管理水平得到极大提升,展现信息中心绩效成绩。
横向收益:该大学横向部门之间沟通更顺畅,效率更高,同时也为整个该大学规范化、精细化管理树立标杆。
纵向收益:为其他信息中心实施精细化管理提供标杆。
解决方案
针对该大学目前故障处理效率低下、技术人员短缺、没有统一的报表汇总数据的问题。豪越科技为该大学提出了部署IT智能运维平台的解决方案。该平台可实现对基础设施监控、应用监控、***监控和日志管理的监控管理以及数据汇聚、处理、展现、通知的运维管理系统,通过该系统可以采集IT环境运行状态指标,通过静态和动态阈值设置实现故障智能预警,让管理员提早发现问题,避免故障发生。
故障时,智能运维平台可及时报警,并实现故障精准定位,让管理员第一时间得知故障发生,并缩短了故障排查时间。智能运维平台应具有故障自动修复功能,当应用服务出现异常时,平台可自动修复并通知,保障重要业务的连续性,将各种风险降到最低。同时,平台可以通过实时展示和报表分析帮助提高日常运行维护效率,及时、准确、全面反映系统的运行状态,保障各业务系统的正常运行,IT智能运维平台具体将达到如下目标:
1
●
强化主动监控,实现集中管理
以IT资源可用性监控为主线,构建统一集成的IT资源、应用服务及网络安全的监控数据采集平台,能够将各类服务器、网络设备实现统一管理,能够主动、及时地发现问题并及时发送告警信息。构建集中、统一的监控大屏,全年365天7*24小时实时展示各项资源和应用系统的整体运行情况,通过智能化运维使原来错综复杂的运维管理工作变的简单和轻松,真正实现了职责分明、安全高效、稳定可靠、智能管控的目标。
2
●
精准定位故障,快速恢复系统运行
具备高效、灵活的告警系统,可设置告警阀值,告警条件、告警级别、告警信息接收人、告警方式等。提供灵活、自动化的事件处理能力。当故障产生时,可进行故障的快速定位,分析并给出故障原因,从而缩短故障解决时间,降低维护成本,提高系统整体可用性。
3
●
故障预警功能
对被监控主机及应用运行数据进行统计与分析,判断可能出现的潜在故障并提醒运维人员,以降低故障率和系统风险。
4
●
运维大数据功能
智能运维平台自动收集响应时间、服务质量、网络状态、网络流量、性能指标、负载情况、故障频率及处理海量运行数据,进行数据关联、挖掘与分析,全面展示数据中心的运行状态、性能情况,为系统升级、改造、运营优化及规模扩展提供科学依据。
5
●
统计分析和决策支持
通过提供各类报表、实时了解全网IT资源的负载与使用情况,根据需要从整体角度考虑资源的使用,同时可以根据业务高峰期的不同来调整业务系统对资源的使用。
6
●
兼容性强
支持多品牌硬件管理,可对不同时期、不同品牌、不同型号的新老设备进行统一管理,并能自动识别设备型号及配置。
7
●
定制化的服务监控能力
运维系统可对IAAS、PAAS、SAAS不同层级的服务进行实时监控与管理,并可根据业务需求灵活修改或新增监控对象,满足用户个性化需求。
8
●
定制报警通知
可根据设备特性自定义告警阀值;根据故障级别、业务划分用户权限管理需求,定制报警形式和设置系统管理人员,使相关责任人第一时间知晓机房运行信息。
9
●
构建知识管理,实现运维经验共享
知识库管理可将 IT 人员日常维护工作的经验或解决方法积累下来,成为有参考价值的知识共享给整个IT 服务组织,有效提高整体支持人员技能素质,提高服务支持效率,降低单点故障率和人员流动所造成的知识风险。
10
●
优异的监控性能和扩展性
运维平台具有大规模及超大规模监控能力及高效处理机制,并具有良好的易用性和升级扩容能力。
用户收益
通过实施豪越HYDO运维监控系统项目,该大学获得了以下收益:
提升 IT 运维管理水平
通过梳理IT 运维管理基本原则、管理策略、组织架构、岗责制度、绩效考核机制,构建IT 运维管理体系,使得IT 运维管理模式与业务管理模式和应用特点能够有机的融合,提升IT 运维管理水平,保障该大学未来在IT 建设方面顺利的推进。
提升 IT 服务水平
通过实现IT 系统、业务过程和关键业务指标的监控,及时发现业务异常和问题,改变传统被动的故障处理方式,最终实现主动的IT 运维服务;从业务角度梳理定义各项IT 服务,制定IT 服务目录及服务质量标准,逐步引入并支持IT 服务级别管理,实现IT 服务质量的持续提升。
提升IT资源管理水平
通过IT运维管理系统,实现多个厂家的网络设备、服务器的统一管理。通过建设全面的监控管理平台,将目前各个业务系统中的各种硬件、软件、业务应用纳入到监控平台中来。消除管理对象之间的差别,消除数据采集手段的差别,消除管理软件的差别,对各种不同数据来源数据统一处理、统一展现、统一用户登录、统一权限控制。
提高 IT 投资效益
实现IT 服务成本可计量、业务效益可衡量,合理引导业务需求,减少无效业务需求数量,在提升关键需求支撑水平的同时降低无效IT投资;稳定系统版本,持续提升IT系统能力,降低建设及维护成本,提高该大学总体IT 投资效率。
标签:豪越,运维,管理,系统,业务,故障,监控,HYDO 来源: https://blog.51cto.com/u_14839944/2826175