Amazon Web Services อ้างว่าเป็นเพราะ “กิจกรรมการใช้งานที่ขยายปริมาณการใช้งานอัตโนมัติ” ที่เกิดจากโค้ดของผู้ใช้บางรายจนกลายเป็นสาเหตุหลักที่ทำให้ระบบล่มเมื่อวันอังคารที่ผ่านมา กระทบกับบริการเจ้าดังระดับโลกมากมาย
ไล่ตั้งแต่ ConnectWise, Netflix, Disney+, Ticketmaster, Flickr และอีกหลายแห่ง ทั้งนี้ AWS ยังกล่าวถึงแผนการป้องกันเหตุการณ์ลักษณะนี้ในอนาคตด้วยว่า จะยกระดับประสิทธิภาพในการสื่อสารเพื่อแก้ปัญหาในช่วงระบบล่มให้ทำได้เร็วขึ้น
เหตุการณ์ครั้งนี้กระทบกับระบบ AWS ในเขตเวอร์จิเนียเหนือ (US-East-1) แล้วประเด็นที่ทำให้ดาวน์ไทม์นานกว่าที่ควรจะเป็นก็เพราะทีมงานฝ่ายปฏิบัติการภายในของ AWS ไม่สามารถตรวจสอบข้อมูลได้แบบเรียลไทม์
นั่นทำให้ AWS ใช้เป็นคำอ้างว่าทำให้ตรวจหาต้นตอที่ทำให้เกิดวามแออัดบนเครือข่ายยากมาก โดยไม่ได้ให้รายละเอียดอื่นใดเพิ่มเติม ทั้งนี้ AWS กล่าวด้วยว่าปกติที่ผ่านมาตัวเองเป็นระบบที่ทำสถิติเรื่อง Availability ได้ดีต่อเนื่องมาโดยตลอด
อ่านเพิ่มเติมที่นี่ – CRN