预案总数
42
Tier 1(自动化)
18
可一键执行
Tier 2(半自动)
19
辅助决策
Tier 3(人工)
5
专家处置
预案 ID 名称 分类 Tier 自动化步骤 关联告警 近 30d 使用次数 操作

预案样例:RB-001 Kafka Broker 异常恢复

触发条件:告警网关识别到 kafka-broker-* 进程退出 / kafka 连接异常类告警
处置步骤
  • 立即 1. 检查 Broker 主机进程状态 systemctl status kafka
  • 立即 2. 流量切换:把异常 broker 的 topic leader 迁移到健康 broker
  • 尽快 3. 重启 Broker 进程
  • 尽快 4. 验证 Broker 重新加入集群,副本同步完成
  • 稍后 5. 分析进程退出根因(dmesg, kafka 日志)
  • 稍后 6. 若反复发生,发起硬件检查工单

预案元信息

预案 IDRB-001
TierTier 1
分类中间件
创建赵明 2025-12-03
最近修订2026-04-22
使用次数近 30d × 6
平均处置耗时12 分钟
成功率100%

关联告警规则

• kafka 运行状态异常
• kafka 连接异常
• kafka topic 未消费条数超限