AWS Glue DataBrew
คืออะไร
AWS Glue DataBrew คือ visual data preparation tool ที่ให้ data analysts และ data scientists ทำ data cleaning และ transformation โดยไม่ต้องเขียน code บริการนี้มี 250+ built-in transformations เช่น การกรองข้อมูล, แก้ไข outliers, normalize, join datasets และ format conversion สามารถ profile ข้อมูลเพื่อดูคุณภาพและ statistics ได้ทันที ผลลัพธ์ที่ได้บันทึกเป็น recipe ที่นำกลับมาใช้และ automate ได้
ราคา
- Interactive sessions: $1.00/session/hour (สำหรับ data exploration ใน console)
- DataBrew jobs: $0.48/node/hour สำหรับ transformation jobs
- Profiling jobs: $0.48/node/hour สำหรับ data profiling
- Free tier: 40 sessions ฟรีใน 60 วันแรก
- ราคาต่ำกว่า interactive Glue Studio sessions
เหมาะสำหรับ
- Data analysts ที่ต้องการเตรียมข้อมูลโดยไม่ต้องเขียน Python หรือ SQL
- ทีมที่ต้องการ explore และทำความเข้าใจ data quality ของ datasets ใหม่
- โครงการ data migration ที่ต้องการ clean และ standardize ข้อมูลจากหลายแหล่ง
- Business users ที่ต้องการเตรียมข้อมูลสำหรับ BI tools โดยอิสระ
Use Case ตัวอย่าง
ทีม marketing analytics ได้รับข้อมูลลูกค้าจากการ merge กิจการ ข้อมูลมีรูปแบบไม่สม่ำเสมอ เช่น ชื่อจังหวัดเขียนต่างกัน, เบอร์โทรมีรูปแบบหลายแบบ และมีค่า missing จำนวนมาก ทีมใช้ DataBrew สร้าง recipe ทำความสะอาดข้อมูลกว่า 2 ล้าน records ด้วย visual interface ใน 2 วัน แทนที่จะต้องเขียน script ใช้เวลา 2 สัปดาห์