Skip to main content

Amazon EMR

คืออะไร

Amazon EMR (Elastic MapReduce) เป็น managed Hadoop cluster บน AWS

คุณสมบัติหลัก

  • รองรับ: Apache Spark, HBase, Presto, Flink, Hive
  • มี 3 ประเภท Node:
    • Master Node — จัดการ cluster ต้องทำงานตลอด
    • Core Node — รัน tasks + เก็บข้อมูล
    • Task Node — รัน tasks เท่านั้น (ใช้ Spot Instances ได้)
  • เลือกได้: Long-running cluster หรือ Transient cluster (ทำเสร็จแล้วปิด)

เหมาะสำหรับ

  • Big Data processing
  • Machine learning
  • Web indexing
  • Data transformations