AWS Glue
คืออะไร
AWS Glue เป็น managed serverless ETL (Extract, Transform, Load) service
คุณสมบัติหลัก
- Glue Data Catalog — เก็บ metadata ของข้อมูล ใช้ร่วมกับ Athena, Redshift Spectrum, EMR
- แปลงรูปแบบข้อมูล เช่น CSV → Parquet เพื่อประสิทธิภาพที่ดีขึ้น
- Job Bookmarks — ป้องกันการ process ข้อมูลซ้ำ
- Glue DataBrew — เครื่องมือ visual สำหรับ clean ข้อมูล 250+ transformations
- Glue Streaming ETL — ETL แบบ real-time จาก Kinesis/Kafka
- Glue Crawlers — สำรวจข้อมูลใน S3/RDS และสร้าง schema อัตโนมัติ