Amazon Data Firehose
คืออะไร
Amazon Data Firehose คือบริการ fully managed สำหรับส่ง streaming data ไปยัง destinations ต่างๆ เช่น S3, Redshift, OpenSearch Service, Splunk และ HTTP endpoints โดยอัตโนมัติ บริการนี้ buffer, compress, encrypt และ transform ข้อมูลระหว่างทางได้โดยไม่ต้องเขียน code ไม่ต้องจัดการ infrastructure และ scale อัตโนมัติตามปริมาณ data ช่วยให้การสร้าง data pipeline ใช้เวลาเพียงไม่กี่นาที
ราคา
- Data ingested: $0.029/GB สำหรับ data ที่ส่งเข้า Firehose
- Dynamic Partitioning: $0.018/GB เพิ่มเติม
- Format Conversion (ORC/Parquet): $0.018/GB เพิ่มเติม
- VPC delivery: $0.01/GB + $0.01/hour/AZ
- ไม่มีค่าขั้นต่ำ จ่ายเฉพาะที่ใช้จริง
เหมาะสำหรับ
- ทีมที่ต้องการส่ง logs, events หรือ metrics ไปยัง data lake หรือ analytics platform อัตโนมัติ
- แอปพลิเคชันที่ต้องการ ingest clickstream หรือ application events ไปยัง S3
- ระบบที่ต้องการส่งข้อมูล IoT sensors ไปยัง OpenSearch สำหรับ visualization
- ทีมที่ต้องการ zero-administration data pipeline โดยไม่ต้องจัดการ servers
Use Case ตัวอย่าง
เว็บไซต์ e-commerce ใช้ Data Firehose รับ clickstream events จากผู้ใช้กว่า 10 ล้าน events ต่อชั่วโมง ส่งไปยัง S3 ในรูปแบบ Parquet แบ่ง partition ตาม date/category อัตโนมัติ ทีม analytics สามารถ query ข้อมูลด้วย Athena ได้ทันที โดยทั้งหมดตั้งค่าเสร็จใน 30 นาที โดยไม่ต้องดูแล infrastructure ใดๆ