Amazon EMR
คืออะไร
Amazon EMR (Elastic MapReduce) เป็น managed Hadoop cluster บน AWS
คุณสมบัติหลัก
- รองรับ: Apache Spark, HBase, Presto, Flink, Hive
- มี 3 ประเภท Node:
- Master Node — จัดการ cluster ต้องทำงานตลอด
- Core Node — รัน tasks + เก็บข้อมูล
- Task Node — รัน tasks เท่านั้น (ใช้ Spot Instances ได้)
- เลือกได้: Long-running cluster หรือ Transient cluster (ทำเสร็จแล้วปิด)
เหมาะสำหรับ
- Big Data processing
- Machine learning
- Web indexing
- Data transformations