# 平台运维架构
# 概述
标准化、自动化、架构优化、过程优化等降低运维服务成本的,运维过程可视化,可量化等操作。 自动化运维是基于流程化的框架,将事件与 IT 流程相关联,一旦被监控系统发现性能超标, 超过预先配置的阀值或宕机,就会触发相关事件以及事先定义好的流程,可自动启动故障响应和恢复机制
# 平台运维规划
平台运维架构针对的是小中大型企业通用自动化运维架构,不适合超大型项目运维
整个运维架构规划
# 运维架构规划
整体运维包含几个方面,用于保障平台、系统运维、监控和预警等,这里的运维主要包括几个角度,架构的规划也在于以下几个点
| 序号 | 内容 | 方案 | 状态 | 备注 |
|---|---|---|---|---|
| 1 | 工单管理 | 禅道 | 完成 | |
| 2 | 日志管理 | Elasticsearch+Logstash+Kibana | 完成 | |
| 3 | 应用监控和预警 | Prometheus+Grafana | 完成 | 监控 redis+jvm+mysql+docker 等 |
| 4 | SQL 监控 | Druid 数据库监控 | 完成 | |
| 5 | 链路跟踪 | Zipkin | 完成 | |
| 7 | 服务器监控和预警 | Zabbix | 完成 | |
| 8 | 服务监控 | K8S | 完成 | |
| 9 | 业务日志和异常预警 | alinesno-cloud-base-logger | 完成 | 自研 |
# 规划说明
# 及时的监控预警
运维过程中及时的预警和监控,及时通知运维人员及异常记录
# 持续可迭代的项目集成
# 运维工单管理
运维工单的管理,处理,跟进,统计,分析,可视化管理
# 批量服务管理
批量服务器的操作和管理,自动化脚本
# 其它
- 略