AWS FIS (Fault Injection Service)
คืออะไร
AWS Fault Injection Service (FIS) คือบริการ chaos engineering ที่ช่วยทดสอบ resilience ของระบบโดยการจำลองความผิดพลาดที่อาจเกิดขึ้นจริง เช่น instance หยุดทำงาน, network latency สูง, CPU spike หรือ AZ outage โดยควบคุมและสังเกตผลลัพธ์แบบ real-time ช่วยให้ทีมพบจุดอ่อนของระบบก่อนที่จะเกิดเหตุการณ์จริง รองรับ AWS services กว่า 20 รายการรวมถึง EC2, ECS, EKS, RDS และ Lambda
ราคา
- ค่า action: $0.10 ต่อ action-minute
- ตัวอย่าง: experiment 10 นาทีที่มี 5 actions = $5.00
- ไม่มี: ค่า setup หรือ minimum fee
- หมายเหตุ: ค่า resource ที่ใช้ระหว่าง experiment คิดแยกตามปกติ
เหมาะสำหรับ
- ทีม DevOps/SRE ที่ต้องการทดสอบ incident response procedure
- Application ที่ต้องการ validate high availability design
- การทดสอบ auto-scaling และ self-healing mechanism
- Compliance ที่ต้องการหลักฐานว่าระบบทนต่อ failure
- ทีมที่ต้องการฝึกซ้อม on-call runbook อย่างสม่ำเสมอ
Use Case ตัวอย่าง
ทีม SRE ของบริษัท fintech ใช้ AWS FIS จำลอง AZ outage ทุกเดือนเพื่อทดสอบว่า EKS cluster และ RDS Multi-AZ failover ทำงานได้จริงภายใน SLA ที่กำหนด ทีมตั้ง stop condition ให้ experiment หยุดอัตโนมัติหาก error rate เกิน 5% และวัด RTO จริงว่าระบบกลับมาปกติใน 2 นาทีตามที่ออกแบบไว้