Skip to main content

AWS Glue

คืออะไร

AWS Glue เป็น managed serverless ETL (Extract, Transform, Load) service

คุณสมบัติหลัก

  • Glue Data Catalog — เก็บ metadata ของข้อมูล ใช้ร่วมกับ Athena, Redshift Spectrum, EMR
  • แปลงรูปแบบข้อมูล เช่น CSV → Parquet เพื่อประสิทธิภาพที่ดีขึ้น
  • Job Bookmarks — ป้องกันการ process ข้อมูลซ้ำ
  • Glue DataBrew — เครื่องมือ visual สำหรับ clean ข้อมูล 250+ transformations
  • Glue Streaming ETL — ETL แบบ real-time จาก Kinesis/Kafka
  • Glue Crawlers — สำรวจข้อมูลใน S3/RDS และสร้าง schema อัตโนมัติ