前言
在微服务架构中,ECS 服务故障排查往往需要在多个 AWS 控制台之间切换,查看日志、指标、事件,耗时且容易遗漏关键信息。本文将介绍如何使用 Kiro CLI 创建一个专业的 ECS 故障分析 Agent,实现一键自动化诊断。
一、Agent 设计理念
1.1 核心目标
- 自动化:输入服务名称即可完成完整诊断流程
- 结构化:按标准流程收集证据,生成可读性强的报告
- 智能化:基于时间线关联分析,识别根本原因
- 可操作:提供具体的修复建议和代码示例
1.2 分析流程设计
服务基本信息 → 健康状态检查 → 应用日志分析 → 基础设施指标 → 关联分析 → 根因判断 → 生成报告二、Agent 创建
2.1 配置文件结构
在~/.kiro/agents/目录下创建failure_analysis_agent.json: