• Ledge
  • 腾讯云-云开发
  • 携程
  • 小米
  • 美团
  • 大型银行转型
  • 招商银行
  • Atlassian
  • Netflix
  • HP
  • Etsy
  • DaoCloud
  • 中国银行
  • 农业银行
  • 华为
  • 百度
  • 腾讯
  • 博云
  • 阿里巴巴
  • 政采云
  • 大搜车
  • 微博
  • 优酷
  • Bilibili

百度

AIOps

百度运维技术演进

基础运维平台的历史阶段
2008 ~ 2012,统一 + 自动化
服务树、权限管理、机器管理、数据管理
监控系统、部署系统、初始化系统
任务管理系统、名字服务……
开放运维平台的历史阶段
2012 ~ 2014, API + 可扩展
可编码的监控
可配置的部署
开放的名字服务
百度云智能运维
2014 至今,数据 + 算法 -> AIOps
数据建设和智能监控入手(异常检测、根因分析)
逐渐覆盖 智能 故障管理/变更管理/容量管理/服务咨询

三个核心:

  • 数据:运维数据仓库 & 运维知识库
  • 工程:运维大数据平台 & 运维工程研发框架
  • 策略:运维策略算法平台 & 运维大脑

智能化运维能力分级

等级名称决策,速度控制对环境的监测高强度执行的应对应对工况
L0人工运维人员运维人员运维人员-
L1工具辅助运维人员+系统运维人员运维人员部分
L2部分自动化系统运维人员运维人员部分
L3有条件的自动化系统系统运维人员部分
L4高速自动化系统系统系统部分
L5完全自动化系统系统系统系统

AIOps 实现路径

level 0:No Automation
手工上线
手工处理故障
人工服务咨询
level 1:OP Assitance
Web 化上线
预案脚本
CMDB
level 2:Partial Automation
自动化上线
自动预案止损
问答机器人
level 3:Conditional Intelligent
弹性扩缩容
智能流量调度
ChatOps
level 4:High Intelligent
无人值守变更
智能 Oncall
智能服务台
level 5:Full Intelligent
智能运维