# 平台运维架构

# 概述

标准化、自动化、架构优化、过程优化等降低运维服务成本的,运维过程可视化,可量化等操作。 自动化运维是基于流程化的框架,将事件与 IT 流程相关联,一旦被监控系统发现性能超标, 超过预先配置的阀值或宕机,就会触发相关事件以及事先定义好的流程,可自动启动故障响应和恢复机制

# 平台运维规划

平台运维架构针对的是小中大型企业通用自动化运维架构,不适合超大型项目运维

整个运维架构规划

# 运维架构规划

整体运维包含几个方面,用于保障平台、系统运维、监控和预警等,这里的运维主要包括几个角度,架构的规划也在于以下几个点

序号 内容 方案 状态 备注
1 工单管理 禅道 完成
2 日志管理 Elasticsearch+Logstash+Kibana 完成
3 应用监控和预警 Prometheus+Grafana 完成 监控 redis+jvm+mysql+docker 等
4 SQL 监控 Druid 数据库监控 完成
5 链路跟踪 Zipkin 完成
7 服务器监控和预警 Zabbix 完成
8 服务监控 K8S 完成
9 业务日志和异常预警 alinesno-cloud-base-logger 完成 自研

# 规划说明

# 及时的监控预警

运维过程中及时的预警和监控,及时通知运维人员及异常记录

# 持续可迭代的项目集成

# 运维工单管理

运维工单的管理,处理,跟进,统计,分析,可视化管理

# 批量服务管理

批量服务器的操作和管理,自动化脚本

# 其它