Skip to main content

AWS Glue DataBrew

คืออะไร

AWS Glue DataBrew คือ visual data preparation tool ที่ให้ data analysts และ data scientists ทำ data cleaning และ transformation โดยไม่ต้องเขียน code บริการนี้มี 250+ built-in transformations เช่น การกรองข้อมูล, แก้ไข outliers, normalize, join datasets และ format conversion สามารถ profile ข้อมูลเพื่อดูคุณภาพและ statistics ได้ทันที ผลลัพธ์ที่ได้บันทึกเป็น recipe ที่นำกลับมาใช้และ automate ได้

ราคา

  • Interactive sessions: $1.00/session/hour (สำหรับ data exploration ใน console)
  • DataBrew jobs: $0.48/node/hour สำหรับ transformation jobs
  • Profiling jobs: $0.48/node/hour สำหรับ data profiling
  • Free tier: 40 sessions ฟรีใน 60 วันแรก
  • ราคาต่ำกว่า interactive Glue Studio sessions

เหมาะสำหรับ

  • Data analysts ที่ต้องการเตรียมข้อมูลโดยไม่ต้องเขียน Python หรือ SQL
  • ทีมที่ต้องการ explore และทำความเข้าใจ data quality ของ datasets ใหม่
  • โครงการ data migration ที่ต้องการ clean และ standardize ข้อมูลจากหลายแหล่ง
  • Business users ที่ต้องการเตรียมข้อมูลสำหรับ BI tools โดยอิสระ

Use Case ตัวอย่าง

ทีม marketing analytics ได้รับข้อมูลลูกค้าจากการ merge กิจการ ข้อมูลมีรูปแบบไม่สม่ำเสมอ เช่น ชื่อจังหวัดเขียนต่างกัน, เบอร์โทรมีรูปแบบหลายแบบ และมีค่า missing จำนวนมาก ทีมใช้ DataBrew สร้าง recipe ทำความสะอาดข้อมูลกว่า 2 ล้าน records ด้วย visual interface ใน 2 วัน แทนที่จะต้องเขียน script ใช้เวลา 2 สัปดาห์