Skip to main content

Disaster Recovery on AWS

RPO vs RTO

  • RPO (Recovery Point Objective) — ข้อมูลที่ยอมเสียได้สูงสุด (เวลาระหว่าง backup ล่าสุดกับ disaster)
  • RTO (Recovery Time Objective) — เวลาที่ยอมรับได้ในการกู้คืนระบบ

DR Strategies (เรียงจากถูกที่สุด → เร็วที่สุด)

1. Backup & Restore

  • RPO สูง (ชั่วโมง), RTO สูง (ชั่วโมง)
  • ราคา ถูกที่สุด
  • ใช้: Storage Gateway/Snowball → S3/Glacier, EBS/RDS Snapshots
  • กู้คืนโดย restore จาก backup

2. Pilot Light

  • ส่วน core ทำงานตลอด (เช่น RDS)
  • EC2 ไม่ทำงาน จนกว่าจะเกิด disaster
  • เร็วกว่า Backup & Restore เพราะ database พร้อมอยู่แล้ว

3. Warm Standby

  • ระบบเต็ม ทำงานที่ ขนาดเล็กสุด
  • เมื่อเกิด disaster → scale up ให้เต็มขนาด
  • RTO ระดับนาที

4. Hot Site / Multi-Site (Active-Active)

  • ระบบ full production scale ทำงานพร้อมกันทั้ง 2 sites
  • RTO ต่ำมาก (วินาที-นาที)
  • ราคา แพงที่สุด

DR Tips

  • EBS/RDS snapshots + S3 cross-region replication
  • Route 53 DNS failover
  • CloudFormation/Beanstalk สำหรับ recreate infrastructure
  • CloudWatch alarms สำหรับ automated recovery