Evolve
เรียนรู้ แบ่งปัน และปรับปรุงอย่างต่อเนื่องเพื่อรักษาความเป็นเลิศด้านการปฏิบัติงาน ควรจัดสรรวงจรการทำงาน (Work cycles) เพื่อทำการปรับปรุงทีละน้อยอย่างต่อเนื่องสม่ำเสมอ จัดให้มีการวิเคราะห์หลังเกิดเหตุ (Post-incident analysis) สำหรับทุกเหตุการณ์ที่ส่งผลกระทบต่อลูกค้า ระบุปัจจัยที่ส่งผล (Contributing factors) และแนวทางการป้องกันเพื่อจำกัดหรือป้องกันการเกิดซ้ำ สื่อสารปัจจัยเหล่านั้นให้ชุมชนที่ได้รับผลกระทบทราบตามความเหมาะสม หมั่นประเมินและจัดลำดับความสำคัญของโอกาสในการปรับปรุงอย่างสม่ำเสมอ (เช่น การขอฟีเจอร์ใหม่, การแก้ไขปัญหา และข้อกำหนดด้านการปฏิบัติตามกฎระเบียบ) ซึ่งครอบคลุมทั้งตัวเวิร์กโหลดและขั้นตอนการปฏิบัติงาน
ใส่ "วงจรข้อมูลย้อนกลับ" (Feedback loops) ไว้ในขั้นตอนการทำงานของคุณ เพื่อระบุส่วนที่ควรปรับปรุงได้อย่างรวดเร็ว และเก็บรับการเรียนรู้จากการรันระบบจริง
แบ่งปันบทเรียนที่ได้รับ (Lessons learned) ข้ามทีมเพื่อให้เกิดประโยชน์ร่วมกัน วิเคราะห์แนวโน้มจากบทเรียนเหล่านั้น และทำการวิเคราะห์ย้อนหลัง (Retrospective analysis) ตัวชี้วัดการปฏิบัติงานร่วมกันระหว่างทีมเพื่อหาโอกาสและวิธีการปรับปรุง ดำเนินการเปลี่ยนแปลงที่ตั้งเป้าเพื่อการปรับปรุง และประเมินผลลัพธ์เพื่อตัดสินความสำเร็จ
บน AWS คุณสามารถส่งออกข้อมูลล็อก (Log data) ไปยัง Amazon S3 หรือส่งล็อกโดยตรงไปยัง Amazon S3 เพื่อการจัดเก็บระยะยาว คุณสามารถใช้ AWS Glue เพื่อค้นหาและเตรียมข้อมูลล็อกใน Amazon S3 สำหรับการวิเคราะห์ และจัดเก็บ Metadata ที่เกี่ยวข้องไว้ใน AWS Glue Data Catalog จากนั้นใช้ Amazon Athena ที่เชื่อมต่อกับ AWS Glue เพื่อวิเคราะห์ข้อมูลล็อกด้วยการ Query โดยใช้มาตรฐาน SQL และใช้เครื่องมือ Business Intelligence อย่าง Amazon QuickSight เพื่อสร้างภาพข้อมูล (Visualize) สำรวจ และวิเคราะห์ข้อมูลของคุณ เพื่อค้นหาแนวโน้มหรือเหตุการณ์ที่น่าสนใจซึ่งอาจนำไปสู่การปรับปรุง
คำถามต่อไปนี้จะเน้นที่การพิจารณาด้านการเป็นเลิศด้านการปฏิบัติงาน:
- OPS 11: คุณพัฒนาการปฏิบัติงาน (Evolve operations) อย่างไร? จัดสรรเวลาและทรัพยากรสำหรับการปรับปรุงทีละน้อยอย่างต่อเนื่อง เพื่อพัฒนาประสิทธิผลและประสิทธิภาพของการปฏิบัติงานของคุณ
การพัฒนาการปฏิบัติงานที่ประสบความสำเร็จมีรากฐานมาจาก: การปรับปรุงเล็กๆ น้อยๆ อย่างสม่ำเสมอ, การจัดเตรียมสภาพแวดล้อมที่ปลอดภัยและให้เวลาในการทดลอง พัฒนา และทดสอบการปรับปรุง รวมถึงสร้างสภาพแวดล้อมที่สนับสนุนการเรียนรู้จากความล้มเหลว การสนับสนุนด้านการปฏิบัติงานสำหรับสภาพแวดล้อม Sandbox, การพัฒนา, การทดสอบ และการใช้งานจริง (Production) โดยมีการเพิ่มระดับการควบคุมการปฏิบัติงานตามลำดับ จะช่วยอำนวยความสะดวกในการพัฒนาและเพิ่มความแม่นยำของผลลัพธ์ความสำเร็จจากการเปลี่ยนแปลงที่นำเข้าสู่ระบบจริง