AWS Resilience Hub

จัดเตรียมและปกป้องแอปพลิเคชันของคุณไม่ให้มีการหยุดชะงัก

ประโยชน์ของ AWS Resilience Hub

ตรวจสอบความถูกต้องและติดตามความยืดหยุ่นของแอปพลิเคชันอย่างต่อเนื่องเพื่อลดการหยุดทำงาน
ประเมินเป้าหมายด้านความสามารถในการกลับสู่สภาวะปกติ (ระยะเวลาที่ใช้ในการกู้คืนข้อมูลและจุดที่ย้อนกลับไปกู้คืนข้อมูลได้)
ระบุและแก้ไขปัญหาก่อนที่จะเกิดขึ้นในการทำงานจริง
ปรับความต่อเนื่องทางธุรกิจให้เหมาะสมไปพร้อมกับลดต้นทุนในการกู้คืน

มันทำงานอย่างไร

AWS Resilience Hub เป็นศูนย์กลางในคอนโซล AWS เพื่อให้คุณจัดการและปรับปรุงพฤติกรรมความยืดหยุ่นของแอปพลิเคชันของคุณบน AWS AWS Resilience Hub ช่วยให้คุณสามารถกําหนดเป้าหมายความยืดหยุ่น ประเมินพฤติกรรมความยืดหยุ่นของคุณเทียบกับเป้าหมายเหล่านั้น และใช้คําแนะนําสําหรับการปรับปรุงตาม เฟรมเวิร์ก AWS Well-Architected ภายใน AWS Resilience Hub คุณยังสามารถสร้างและเรียกใช้การทดลอง AWS Fault Injection Service (AWS FIS) ซึ่งเลียนแบบการหยุดชะงักในชีวิตจริงของแอปพลิเคชันของคุณ เพื่อช่วยให้คุณเข้าใจการพึ่งพาได้ดีขึ้นและค้นพบจุดอ่อนที่อาจเกิดขึ้น

AWS Resilience Hub ให้บริการและเครื่องมือที่คุณต้องการเพื่อส่งเสริมความยืดหยุ่นของคุณอย่างต่อเนื่องอย่างครบวงจร 

คุณสมบัติ

อธิบายแอปพลิเคชันของคุณว่าเป็นคอลเลกชันทรัพยากร เช่น สแต็ก CloudFormation ไฟล์สถานะ Terraform แอปพลิเคชัน AppRegistry หรือกลุ่มทรัพยากร หรือกำหนดแอปพลิเคชันสำหรับเวิร์กโหลด Kubernetes ที่จัดการบน Amazon EKS แอปพลิเคชันยังสามารถอธิบายโดยใช้ทั้งคอลเลกชันทรัพยากรและคลัสเตอร์ Amazon EKS ได้อีกด้วย
กำหนดนโยบายด้านความสามารถในการกลับสู่สภาวะปกติให้กับแอปพลิเคชันของคุณ นโยบายเหล่านี้ประกอบด้วยเป้าหมายด้าน RTO และ RPO สำหรับการหยุดชะงักของแอปพลิเคชัน, โครงสร้างพื้นฐาน, Availability Zone และ Region

การประเมินของ AWS Resilience Hub ใช้แนวทางปฏิบัติที่ดีที่สุดจาก AWS Well-Architected Framework เพื่อวิเคราะห์องค์ประกอบของแอปพลิเคชันและค้นหาจุดอ่อนด้านความสามารถในการกลับสู่สภาวะปกติที่อาจเกิดขึ้น โดยจุดอ่อนเหล่านี้อาจเกิดจากการตั้งค่าโครงสร้างพื้นฐานที่ไม่สมบูรณ์ การกำหนดค่าที่ไม่ถูกต้อง หรือสถานการณ์ที่จำเป็นต้องได้รับการปรับปรุงการกำหนดค่าเพิ่มเติม

AWS Resilience Hub ให้คำแนะนำที่นำไปปฏิบัติได้เพื่อปรับปรุงความสามารถในการกลับสู่สภาวะปกติ นอกจากนี้ การประเมินความสามารถในการกลับสู่สภาวะปกติยังสร้างส่วนย่อยของโค้ดที่ช่วยให้คุณสร้างขั้นตอนการกู้คืนในรูปแบบเอกสารของ AWS Systems Manager สำหรับแอปพลิเคชันของคุณ ซึ่งเรียกว่าขั้นตอนมาตรฐานในการปฏิบัติงาน (Standard Operating Procedure - SOP) อีกด้วย AWS Resilience Hub จะสร้างรายการของการเฝ้าติดตามและการแจ้งเตือนของ Amazon CloudWatch ที่แนะนำ เพื่อช่วยให้ผู้ปฏิบัติงานสามารถระบุการเปลี่ยนแปลงใดๆ ต่อเสถียรภาพด้านความสามารถในการกลับสู่สภาวะปกติของแอปพลิเคชันได้อย่างรวดเร็วเมื่อมีการปรับใช้แล้ว

หลังจากแอปพลิเคชันและ SOP ได้รับการอัปเดตเพื่อให้รวมสิ่งที่แนะนำจากการประเมินความสามารถในการกลับสู่สภาวะปกติเรียบร้อยแล้ว คุณสามารถใช้ AWS Resilience Hub เพื่อทดสอบและยืนยันได้ว่าแอปพลิเคชันของคุณทำงานได้ตามเป้าหมายด้านความสามารถในการกลับสู่สภาวะปกติ ก่อนที่จะเผยแพร่เพื่อใช้งานจริง AWS Resilience Hub ผสานรวมบริการทดสอบความยืดหยุ่นของระบบต่อสถานการณ์รุนแรงอย่าง AWS Fault Injection Simulator (FIS) เพื่อป้อนความล้มเหลวในโลกแห่งความเป็นจริงลงในการจำลองสถานการณ์ที่มีการเพิ่มข้อผิดพลาดลงไป เพื่อตรวจสอบความถูกต้องว่าแอปพลิเคชันฟื้นตัวได้ภายในเป้าหมายด้านความสามารถในการกลับสู่สภาวะปกติตามที่กำหนดไว้ ข้อผิดพลาดที่ว่านี้อาจรวมถึงข้อผิดพลาดของเครือข่าย หรือการมีการเชื่อมต่อแบบเปิดจำนวนมากเกินไปยังฐานข้อมูลเพียงแห่งเดียว นอกจากนี้ AWS Resilience Hub ยังมี API ที่ช่วยให้คุณผสานรวมการประเมินและการทดสอบความสามารถในการกลับสู่สภาวะปกติเข้ากับไปป์ไลน์ CI/CD เพื่อตรวจสอบความถูกต้องของความสามารถในการกลับสู่สภาวะปกติอย่างต่อเนื่องได้อีกด้วย การผสานรวมการตรวจสอบความถูกต้องของความสามารถในการกลับสู่สภาวะปกติเข้ากับไปป์ไลน์ CI/CD ช่วยให้มั่นใจได้ว่า การเปลี่ยนแปลงต่อโครงสร้างพื้นฐานที่จำเป็นของแอปพลิเคชันจะไม่ทำให้ความสามารถในการกลับสู่สภาวะปกติต้องลดลง

กรณีใช้งาน

ใช้การป้อนความล้มเหลวในโลกแห่งความเป็นจริงลงในการจำลองสถานการณ์ที่มีการเพิ่มข้อผิดพลาดลงไป เพื่อช่วยตรวจสอบประสิทธิภาพของขั้นตอนมาตรฐานในการปฏิบัติงาน (SOP) และการแจ้งเตือนสำหรับการกู้คืนข้อมูล

ให้คำแนะนำที่นำไปปฏิบัติได้เพื่อปรับปรุงความสามารถในการกลับสู่สภาวะปกติและช่วยให้คุณสร้างขั้นตอนการกู้คืนข้อมูล

เก็บรักษาข้อมูลเส้นทางการตรวจสอบกิจกรรมในระหว่างการหยุดทำงานตามแผนและนอกแผน เพื่อช่วยให้เป็นไปตามข้อบังคับด้านการปฏิบัติตามข้อกำหนดและกฎข้อบังคับ

ลูกค้า

โลโก้ Pearson

“ด้วย AWS Resilience Hub เราสามารถดูว่าแอปพลิเคชันของเราทำอะไร... และถามตัวเองว่านี่เป็นแอปพลิเคชันที่สำคัญสำหรับภารกิจหรือจะหยุดทำงานสักครู่ได้โดยไม่ส่งผลกระทบต่อการดำเนินงานของเราหรือไม่' AWS Resilience Hub มีความสำคัญต่อเรื่องนั้น เนื่องจากเราสามารถป้อนค่าและเข้าใจได้อย่างรวดเร็วว่าแอปพลิเคชันใดมีความสำคัญจริงๆ ต่อ Pearson”


-Ronnie Kendrick ผู้จัดการอาวุโส SRE ฝ่ายโครงสร้างพื้นฐานและการดำเนินงานของ Pearson

Pearson ใช้ AWS Resilience Hub เพื่อปรับปรุงความยืดหยุ่นของแอปพลิเคชัน

“ADL Digital Labs (ADL) ถือกำเนิดขึ้นในปี 2017 และปัจจุบันเป็นหนึ่งในแพลตฟอร์มที่ดีที่สุดในการส่งเสริมผลิตภัณฑ์ดิจิทัลสำหรับอุตสาหกรรมบริการทางด้านการเงินในละตินอเมริกา ด้วยการตระหนักถึงความสำคัญของการส่งมอบโซลูชันที่เชื่อถือได้สูงให้กับลูกค้า ADL จึงได้ร่วมใช้งาน AWS Resilience Hub เพื่อตรวจสอบและติดตามสถานะความยืดหยุ่นของแอปพลิเคชัน และรักษาการมองเห็นการปฏิบัติตามนโยบายและเป้าหมายความพร้อมใช้งานไปในขณะเดียวกันด้วย การผสานการทำงาน AWS Resilience Hub เข้ากับเฟรมเวิร์กความต่อเนื่องทางธุรกิจของ ADL สทำให้มีการตรวจสอบความยืดหยุ่นและความต่อเนื่องทางธุรกิจสำหรับช่องทางการทำธุรกรรม 8 ช่องทาง โดยให้บริการลูกค้าประมาณ 4 ล้านรายในองค์กรทางการเงินหลัก 4่ แห่งของโคลอมเบีย” - Alexander Chaparro หัวหน้าฝ่ายสถาปัตยกรรมของ Aval Digital Labs


สำรวจ AWS เพิ่มเติม