Skip to main content

Manage demand and supply resources

เมื่อคุณย้ายมาใช้งานคลาวด์ คุณจะจ่ายเฉพาะสิ่งที่จำเป็นต้องใช้เท่านั้น คุณสามารถจัดสรรทรัพยากรให้สอดคล้องกับความต้องการของเวิร์กโหลด ณ เวลาที่จำเป็นต้องใช้ ซึ่งช่วยลดความจำเป็นในการจัดสรรทรัพยากรเผื่อไว้มากเกินไป (Over-provisioning) ที่ทั้งสิ้นเปลืองและมีราคาสูง นอกจากนี้คุณยังสามารถปรับเปลี่ยนรูปแบบความต้องการใช้งาน (Demand) ได้ โดยการใช้การจำกัดปริมาณ (Throttle), ตัวพักข้อมูล (Buffer) หรือคิว (Queue) เพื่อทำให้ความต้องการใช้งานราบรื่นขึ้น และตอบสนองด้วยทรัพยากรที่น้อยลงซึ่งส่งผลให้ต้นทุนต่ำลง หรือเลือกประมวลผลในภายหลังด้วยบริการแบบประมวลผลเป็นชุด (Batch service)

ใน AWS คุณสามารถจัดสรรทรัพยากรแบบอัตโนมัติเพื่อให้สอดคล้องกับความต้องการของเวิร์กโหลด การใช้ Auto Scaling ตามความต้องการใช้งานหรือตามเวลา ช่วยให้คุณเพิ่มและลดทรัพยากรได้ตามความจำเป็น หากคุณสามารถคาดการณ์การเปลี่ยนแปลงของความต้องการได้ คุณจะสามารถประหยัดเงินได้มากขึ้นและยืนยันได้ว่าทรัพยากรของคุณสอดคล้องกับความต้องการของเวิร์กโหลดอย่างแท้จริง คุณสามารถใช้ Amazon API Gateway เพื่อจำกัดปริมาณการใช้งาน (Throttling) หรือใช้ Amazon SQS เพื่อสร้างระบบคิวในเวิร์กโหลด ซึ่งทั้งสองอย่างนี้จะช่วยให้คุณปรับเปลี่ยนรูปแบบความต้องการใช้งานที่มีต่อส่วนประกอบต่างๆ ของเวิร์กโหลดได้

คำถามต่อไปนี้จะเน้นที่การพิจารณาด้านการจัดการต้นทุนให้คุ้มค่า:

COST 9: คุณจัดการอุปสงค์ (Demand) และจัดสรรทรัพยากร (Supply) อย่างไร? สำหรับเวิร์กโหลดที่มีความสมดุลระหว่างการใช้จ่ายและประสิทธิภาพ ให้ตรวจสอบว่าทุกสิ่งที่คุณจ่ายไปนั้นถูกใช้งานจริง และหลีกเลี่ยงการปล่อยให้อินสแตนซ์มีการใช้งานต่ำเกินไป (Underutilizing) อย่างมีนัยสำคัญ ตัวชี้วัดการใช้งานที่เอนเอียงไปในทิศทางใดทิศทางหนึ่งล้วนส่งผลเสียต่อองค์กร ไม่ว่าจะเป็นด้านต้นทุนการดำเนินงาน (ประสิทธิภาพลดลงจากการใช้งานหนักเกินไป) หรือการสิ้นเปลืองค่าใช้จ่าย AWS (จากการจัดสรรทรัพยากรเผื่อไว้มากเกินไป)

เมื่อออกแบบเพื่อปรับเปลี่ยนอุปสงค์และจัดสรรทรัพยากร ให้คำนึงถึงรูปแบบการใช้งาน ระยะเวลาที่ใช้ในการจัดสรรทรัพยากรใหม่ และความสามารถในการคาดการณ์ของรูปแบบความต้องการใช้งาน ในการจัดการความต้องการใช้งาน (Demand) ให้ตรวจสอบว่าคุณมีขนาดของคิวหรือตัวพักข้อมูล (Buffer) ที่ถูกต้อง และคุณกำลังตอบสนองต่อความต้องการของเวิร์กโหลดภายในระยะเวลาที่กำหนด