什么是运维体系

直接上图

运维体系

运维的所有工作,都是在对运维对象进行标准化实施

运维工作该怎么做?做到什么程度?有什么样的检验指标? 这就涉及到运维指标以及运营指标,运维指标体现在监控,安全,可靠,稳定等要求上;运营指标体现在成本,效益,体验,效率等指标上。在这些指标上,通过标准,制度,流程,工具运维能力来完成

最后,面向业务,运维应该输出什么样的决策支持?面向技术,怎样沿着 标准化 --> 自动化 --> 智能化 的方向前进,如何进行知识沉淀等。

以上内容即为运维体系的概况

下面就从几个不同的视角来看运维体系:

运维对象

对象分层,这里每个公司都会按照组织架构,岗位职责来划分,略有差异。有的公司会有基础设施部门,分管机房,云服务,操作系统等,有的公司可能有系统工程师,分管操作系统,云服务,有的会有应用运维工程师,分管应用服务,中间件等…

基础设施:运营商专线、机房(机房内的设施,比如制冷、安防等)
资源池:硬件服务器,存储,公有云,vcenter,docker,k8s
系统层:操作系统,中间件,数据库,网络
应用服务:应用服务可用性、状态、应用性能
客户体验:客户端体验

运维能力

  • 标准(配置标准、操作标准、评判标准、分级分类标准、权责标准 … …)
  • 流程(故障管理、请求管理、变更管理、问题管理、风险管理 … …)
  • 制度(操作规范、管理规范、行为准则、安全法则 … …)
  • 工具(ITSD、监控管理、操作管理、资源管理、知识管理 … …)

运维运营能力

  • 运维作为服务提供商
  • 定义服务目录(参考ITIL)
  • 理解服务成本
  • 保证SLA
  • 度量和报告服务可用性

总结

如何理解运维体系,其实是可以从不同的角度切入的,这也是每个公司管理运维方式的差异吧。方法不同但核心目标是一致的,保障并维护生产环境的可用性