Skip to main content

Amazon Managed Service for Apache Flink

ตอนนี้เราจะพูดถึง Amazon Managed Service for Apache Flink

  • ก่อนหน้านี้ชื่อว่า Kinesis Data Analytics for Apache Flink
  • ปัจจุบันถูกเรียกว่า Managed Service for Apache Flink

Flink เป็น framework สำหรับ ประมวลผลข้อมูลสตรีมแบบเรียลไทม์ (real-time data stream processing)

  • รองรับการเขียนโปรแกรมด้วย Java, SQL, หรือ Scala
  • ใช้ในการ ประมวลผลข้อมูลที่ไหลเข้ามาอย่างต่อเนื่อง

แหล่งข้อมูลและการเชื่อมต่อ (Data Sources & Integration)

Amazon Managed Service for Apache Flink สามารถ อ่านข้อมูลจาก:

  • Kinesis Data Streams
  • Amazon MSK (Managed Apache Kafka)

หมายเหตุ: Amazon MSK เป็นบริการ managed สำหรับ Apache Kafka ของ AWS ซึ่งใช้สำหรับ data streams แบบเรียลไทม์

  • บริการนี้ทำให้คุณสามารถ รัน Flink application บน managed cluster ของ AWS ได้
  • AWS จะ จัดสรร compute resources ให้, รองรับการประมวลผลแบบขนาน (parallel computation), และปรับขนาดอัตโนมัติ (auto scaling)

คุณสมบัติการจัดการแอปพลิเคชัน (Application Management Features)

  • AWS จะดูแล backup ของแอปพลิเคชัน ซึ่ง implement เป็น checkpoints และ snapshots
  • สามารถใช้ ฟีเจอร์ของ Apache Flink ในการแปลงข้อมูล ได้อย่างอิสระ

หมายเหตุสำคัญเกี่ยวกับแหล่งข้อมูล

  • Flink สามารถอ่านจาก Kinesis Data Streams
  • Flink ไม่สามารถอ่านจาก Amazon Data Firehose

ข้อนี้มักเป็น exam trick ที่ควรจำ

สรุป

  • Amazon Managed Service for Apache Flink ใช้สำหรับ ประมวลผลข้อมูลสตรีมเท่านั้น
  • บริการนี้ จัดการ compute resources, parallel computation, auto scaling, และ backup แอปพลิเคชัน ให้โดย AWS

Key Takeaways

  • เป็นบริการ managed สำหรับรัน Apache Flink บน AWS
  • รองรับ การประมวลผลข้อมูลสตรีมแบบเรียลไทม์ ด้วย Java, SQL, หรือ Scala
  • สามารถดึงข้อมูลจาก Kinesis Data Streams และ Amazon MSK (Apache Kafka)
  • AWS ดูแล compute resources, parallel computation, auto scaling, และ backup ผ่าน checkpoints และ snapshots