กระบวนการกู้คืนจากความเสียหายคืออะไร

กระบวนการกู้คืนจากความเสียหายเป็นกระบวนการที่องค์กรใช้ในการเตรียมรับมือและแก้ไขปัญหาภัยพิบัติที่เกี่ยวข้องกับเทคโนโลยี กระบวนการเตรียมความพร้อมและกู้คืนจากเหตุการณ์ใด ๆ ที่ป้องกันไม่ให้เวิร์กโหลดหรือระบบปฏิบัติตามวัตถุประสงค์ทางธุรกิจในสถานที่หลักที่ปรับใช้ เช่น ไฟฟ้าดับ เหตุการณ์ทางธรรมชาติ หรือปัญหาด้านความปลอดภัย เป้าหมายของกระบวนการกู้คืนจากความเสียหายจะตรวจวัดด้วยจุดที่ย้อนกลับไปกู้คืนข้อมูลได้ (RPO) และระยะเวลาที่ใช้ในการกู้คืนข้อมูล (RTO) ความล้มเหลวที่จัดการโดยกระบวนการกู้คืนจากความเสียหายมักจะหายากกว่าความล้มเหลวที่ครอบคลุมโดยความพร้อมใช้งานสูง และเป็นเหตุการณ์ภัยพิบัติขนาดใหญ่กว่า กระบวนการกู้คืนจากความเสียหายรวมไปถึงกระบวนการและนโยบายขององค์กรในการกู้คืนให้ได้อย่างรวดเร็วจากเหตุการณ์ดังกล่าว

เหตุใดกระบวนการกู้คืนจากความเสียหายจึงมีความสำคัญ

ความเสียหายคือปัญหาที่ไม่คาดคิดซึ่งเป็นผลจากการช้าลง การหยุดชะงัก หรือการหยุดทำงานของเครือข่ายในระบบด้านไอที การหยุดทำงานเกิดขึ้นในหลายรูปแบบ ซึ่งรวมถึงตัวอย่างต่อไปนี้:

  • แผ่นดินไหวหรืออัคคีภัย
  • ความล้มเหลวของเทคโนโลยี
  • ความเข้ากันไม่ได้ของระบบ
  • ความผิดพลาดง่าย ๆ ของมนุษย์ 
  • การเข้าถึงโดยไม่ได้รับอนุญาตโดยตั้งใจโดยบุคคลภายนอก

ความเสียหายเหล่านี้ทำให้การดำเนินธุรกิจหยุดชะงัก ส่งผลให้เกิดปัญหาในการบริการลูกค้า และทำให้สูญเสียรายได้ แผนกระบวนการกู้คืนจากความเสียหายช่วยองค์กรให้ตอบสนองต่อเหตุการณ์ที่ทำให้การดำเนินธุรกิจหยุดชะงักได้โดยทันที และให้ประโยชน์ที่สำคัญ:

รับรองความต่อเนื่องทางธุรกิจ

เมื่อมีความเสียหายเกิดขึ้น ก็อาจส่งผลร้ายต่อทุกแง่มุมของธุรกิจ และมักมีค่าใช้จ่ายสูง อีกทั้งยังทำให้การดำเนินธุรกิจตามปกติหยุดชะงัก เพราะความสามารถในการทำงานของทีมลดลงเนื่องจากสามารถเข้าถึงเครื่องมือที่ตนต้องใช้ในการทำงานได้จำกัด แผนกระบวนการกู้คืนจากความเสียหายทำให้มีการรีสตาร์ทระบบการสำรองข้อมูลและข้อมูลอย่างรวดเร็ว เพื่อให้การดำเนินธุรกิจดำเนินต่อไปได้ตามกำหนดการ 

เพิ่มการรักษาความปลอดภัยของระบบ

การรวมกระบวนการคุ้มครองข้อมูล การสำรองข้อมูล และการกู้คืนไว้ในแผนกระบวนการกู้คืนจากความเสียหายจำกัดผลกระทบจากแรนซัมแวร์ มัลแวร์ หรือความเสี่ยงต่อความปลอดภัยอื่น ๆ สำหรับธุรกิจ ตัวอย่างเช่น การสำรองข้อมูลไปยังคลาวด์มีคุณสมบัติการรักษาความปลอดภัยในตัวมากมายเพื่อจำกัดกิจกรรมที่น่าสงสัยก่อนที่จะส่งผลกระทบต่อธุรกิจ 

เพิ่มการรักษาลูกค้า

หากมีความเสียหายเกิดขึ้น ลูกค้าจะตั้งคำถามถึงความเสถียรของบริการการรักษาความปลอดภัยขององค์กร ยิ่งความเสียหายส่งผลกระทบต่อธุรกิจนานเท่าใด ลูกค้าก็ยิ่งไม่พอใจมากขึ้นเท่านั้น แผนกระบวนการกู้คืนจากความเสียหายที่ดีจะบรรเทาความเสี่ยงนี้ด้วยการฝึกอบรมพนักงานให้รับมือกับข้อคำถามของลูกค้า ลูกค้าจะมีความมั่นใจเมื่อสังเกตเห็นว่าธุรกิจเตรียมพร้อมรับมือกับความเสียหายทั้งหมดเป็นอย่างดี 

ลดต้นทุนในการกู้คืน

ความเสียหายทำให้สูญเสียทั้งรายได้และความสามารถในการทำงาน ขึ้นอยู่กับความรุนแรงของความเสียหาย แผนกระบวนการกู้คืนจากความเสียหายที่แข็งแกร่งจะหลีกเลี่ยงการสูญเสียที่ไม่จำเป็นในขณะที่ระบบกลับสู่สภาวะปกติไม่นานหลังจากที่เกิดเหตุการณ์ ตัวอย่างเช่น โซลูชันพื้นที่จัดเก็บข้อมูลบนระบบคลาวด์เป็นวิธีการสำรองข้อมูลที่ประหยัดต้นทุน คุณสามารถจัดการ เฝ้าติดตาม และเก็บรักษาข้อมูลในขณะที่ธุรกิจดำเนินไปตามปกติ 

กระบวนการกู้คืนจากความเสียหายทำงานอย่างไร

กระบวนการกู้คืนจากความเสียหายมุ่งเน้นที่การทำให้แอปพลิเคชันต่าง ๆ กลับมาทำงานภายในเวลาไม่กี่นาทีที่เกิดเหตุการณ์การหยุดทำงาน องค์กรจัดการกับสามองค์ประกอบต่อไปนี้:

การป้องกัน

เพื่อลดโอกาสที่จะเกิดความเสียหายที่เกี่ยวข้องกับเทคโนโลยี ธุรกิจจำเป็นต้องมีแผนเพื่อให้แน่ใจว่าระบบที่สำคัญทั้งหมดมีความน่าเชื่อถือและปลอดภัยมากที่สุดเท่าที่จะเป็นไปได้ เพราะมนุษย์ไม่สามารถควบคุมภัยธรรมชาติได้ การป้องกันจึงใช้กับปัญหาของเครือข่าย ความเสี่ยงต่อการรักษาความปลอดภัย และความผิดพลาดของมนุษย์เท่านั้น คุณต้องจัดเตรียมเครื่องมือและเทคนิคที่เหมาะสมเพื่อป้องกันความเสียหาย ตัวอย่างเช่น ซอฟต์แวร์ทดสอบระบบที่ตรวจสอบไฟล์การกำหนดค่าใหม่ทั้งหมดโดยอัตโนมัติก่อนที่จะนำมาใช้สามารถป้องกันข้อผิดพลาดและความล้มเหลวของการกำหนดค่าได้ 

การคาดคะเน

การคาดคะเนรวมถึงการคาดการณ์ความเสียหายที่อาจเกิดขึ้นในอนาคต การรู้ผลที่จะเกิดขึ้น และการวางแผนขั้นตอนกระบวนการกู้คืนจากความเสียหายที่เหมาะสม การคาดการณ์สิ่งที่อาจเกิดขึ้นเป็นเรื่องท้าทาย แต่คุณสามารถคิดแนวทางกระบวนการกู้คืนจากความเสียหายโดยใช้ความรู้จากสถานการณ์และการวิเคราะห์ที่มีก่อนหน้า ตัวอย่างเช่น การสำรองข้อมูลธุรกิจที่สำคัญทั้งหมดไปยังระบบคลาวด์เพื่อเตรียมพร้อมหากเกิดความล้มเหลวของฮาร์ดแวร์ในอนาคตกับอุปกรณ์ในองค์กรคือแนวทางที่ใช้ได้จริงในการจัดการข้อมูล

การบรรเทา

การบรรเทาคือวิธีที่ธุรกิจตอบสนองหลังจากที่เกิดเหตุการณ์ความเสียหาย กลยุทธ์การบรรเทามีจุดมุ่งหมายที่จะลดผลกระทบด้านลบต่อขั้นตอนการดำเนินธุรกิจตามปกติ ผู้มีส่วนได้ส่วนเสียที่สำคัญทั้งหมดรู้สิ่งที่ต้องทำในกรณีที่เกิดความเสียหาย ซึ่งรวมถึงขั้นตอนต่อไปนี้:

  • การปรับปรุงเอกสารประกอบให้เป็นปัจจุบัน
  • การดำเนินการทดสอบกระบวนการกู้คืนจากความเสียหายอย่างสม่ำเสมอ
  • การระบุขั้นตอนการปฏิบัติงานด้วยมือในกรณีที่เกิดการหยุดทำงานของระบบ
  • การประสานงานกลยุทธ์กระบวนการกู้คืนจากความเสียหายกับบุคลากรที่เกี่ยวข้อง

องค์ประกอบที่สำคัญของแผนกระบวนการกู้คืนจากความเสียหายคืออะไร

แผนกระบวนการกู้คืนจากความเสียหายที่มีประสิทธิผลรวมถึงองค์ประกอบที่สำคัญต่อไปนี้: 

การสื่อสารภายในและภายนอก

ทีมที่รับผิดชอบในการจัดทำ ดำเนินการ และจัดการแผนกระบวนการกู้คืนจากความเสียหายต้องมีการสื่อสารกันเกี่ยวกับบทบาทและความรับผิดชอบของตน หากมีความเสียหายเกิดขึ้น ทีมควรรู้ว่าใครรับผิดชอบเรื่องอะไร และจะสื่อสารกับพนักงาน ลูกค้า และกันและกันได้อย่างไร 

กรอบระยะเวลาการกู้คืน

ทีมกระบวนการกู้คืนจากความเสียหายต้องตัดสินใจเป้าหมายและกรอบระยะเวลาว่าระบบควรกลับมาทำงานตามปกติหลังจากที่เกิดความเสียหายเมื่อใด ในบางอุตสาหกรรมกรอบระยะเวลาอาจนานกว่าอุตสาหกรรมอื่น ๆ ในขณะที่บางอุตสาหกรรมจะต้องกลับมาทำงานตามปกติให้ได้ในช่วงเวลาไม่กี่นาที 

กรอบระยะเวลานี้ควรคำนึงถึงกับวัตถุประสงค์สองประการดังต่อไปนี้:

วัตถุประสงค์ของระยะเวลาที่ใช้ในการกู้คืน

ระยะเวลาที่ใช้ในการกู้คืนข้อมูล (RTO) คือตัววัดที่ระบุระยะเวลาสูงสุดที่ผ่านไปก่อนที่คุณจะดำเนินกระบวนการกู้คืนจากความเสียหายเสร็จสิ้น RTO ของคุณอาจแตกต่างกันออกไปโดยขึ้นอยู่กับโครงสร้างพื้นฐานและระบบด้านไอทีที่ได้รับผลกระทบ

จุดที่ย้อนกลับไปกู้คืนข้อมูลได้

จุดที่ย้อนกลับไปกู้คืนข้อมูลได้ (RPO) คือระยะเวลาสูงสุดที่ยอมรับได้สำหรับการสูญเสียข้อมูลหลังจากที่เกิดความเสียหาย ตัวอย่างเช่น ถ้า RPO ของคุณคือไม่กี่นาทีหรือไม่กี่ชั่วโมง คุณจะต้องสำรองข้อมูลของคุณไปยังไซต์มิเรอร์อย่างต่อเนื่อง แทนที่จะแค่ครั้งเดียวเมื่อสิ้นสุดวัน

การสำรองข้อมูล

แผนกระบวนการกู้คืนจากความเสียหายกำหนดว่าคุณจะสำรองข้อมูลของคุณอย่างไร ตัวเลือกที่มีรวมถึงพื้นที่จัดเก็บข้อมูลบนระบบคลาวด์ การสำรองข้อมูลโดยผู้ให้บริการ และการสำรองข้อมูลภายในไปยังเซิร์ฟเวอร์ระยะไกล เพื่อรองรับเหตุการณ์ภัยธรรมชาติ ข้อมูลสำรองจึงไม่ควรอยู่ในสถานที่ ทีมควรระบุว่าใครจะเป็นผู้สำรองข้อมูล ข้อมูลใดบ้างที่ควรสำรอง และวิธีการนำระบบมาใช้

การทดสอบและการเพิ่มประสิทธิภาพ 

คุณต้องทดสอบแผนกระบวนการกู้คืนจากความเสียหายของคุณอย่างน้อยปีละครั้งหรือสองครั้ง คุณสามารถบันทึกและแก้ไขช่องว่างใด ๆ ที่คุณพบในการทดสอบเหล่านี้ได้ ในทำนองเดียวกัน คุณควรอัปเดตกลยุทธ์การรักษาความปลอดภัยและการคุ้มครองข้อมูลทั้งหมดบ่อย ๆ เพื่อป้องกันการเข้าถึงโดยไม่ได้รับอนุญาตโดยเลินเล่อ

คุณสามารถตั้งทีมกระบวนการกู้คืนจากความเสียหายได้อย่างไร

ทีมกระบวนการกู้คืนจากความเสียหายรวมถึงทีมการทำงานร่วมกันที่ประกอบด้วยผู้เชี่ยวชาญต่าง ๆ เช่น ผู้เชี่ยวชาญด้านไอที และบุคคลในบทบาทผู้นำซึ่งจะเป็นบุคคลที่สำคัญสำหรับทีม คุณควรให้ใครสักคนในทีมดูแลด้านที่สำคัญต่อไปนี้:

การจัดการวิกฤติ

บุคคลที่รับผิดชอบการจัดการวิกฤติจะนำแผนกระบวนการกู้คืนจากความเสียหายมาปฏิบัติทันที บุคคลเหล่านี้จะสื่อสารกับสมาชิกในทีมคนอื่น ๆ และลูกค้า และประสานงานในกระบวนการกู้คืนจากความเสียหาย 

ความต่อเนื่องทางธุรกิจ

ผู้จัดการความต่อเนื่องทางธุรกิจจะทำให้แน่ใจว่าแผนกระบวนการกู้คืนจากความเสียหายสอดคล้องกับผลลัพธ์จากการวิเคราะห์ผลกระทบต่อธุรกิจ บุคคลเหล่านี้จะรวมการวางแผนความต่อเนื่องทางธุรกิจเข้าในกลยุทธ์กระบวนการกู้คืนจากความเสียหาย 

การกู้คืนและการประเมินผลกระทบ

ผู้จัดการการประเมินผลกระทบคือผู้เชี่ยวชาญในโครงสร้างพื้นฐานด้านไอทีและแอปพลิเคชันธุรกิจ บุคคลเหล่านี้จะประเมินและแก้ไขโครงสร้างพื้นฐานของเครือข่าย เซิร์ฟเวอร์ และฐานข้อมูล และยังจัดการงานกระบวนการกู้คืนจากความเสียหาย เช่น ตัวอย่างต่อไปนี้:

  • การผสานรวมแอปพลิเคชัน
  • การรักษาความสอดคล้องกันของข้อมูล
  • การตั้งค่าและการกำหนดค่าแอปพลิเคชัน

วิธีที่ดีที่สุดสำหรับกระบวนการกู้คืนจากความเสียหายคืออะไร

เมื่อวางแผนกระบวนการกู้คืนจากความเสียหาย ธุรกิจจะใช้วิธีการหนึ่งหรือหลายอย่างดังต่อไปนี้:

การสำรองข้อมูล

การสำรองข้อมูลเป็นหนึ่งในวิธีที่ง่ายที่สุดในกระบวนการกู้คืนจากความเสียหายที่ทุกธุรกิจนำไปใช้ การสำรองข้อมูลที่สำคัญรวมถึงการจัดเก็บข้อมูลไว้นอกสถานที่ ในระบบคลาวด์ หรือบนสื่อที่ถอดออกได้ คุณควรสำรองข้อมูลบ่อย ๆ เพื่อให้เป็นปัจจุบันอยู่เสมอ ตัวอย่าง การสำรองข้อมูลไปยัง AWS จะทำให้ธุรกิจได้รับโครงสร้างพื้นฐานที่ยืดหยุ่นและปรับขนาดได้ ซึ่งปกป้องข้อมูลได้ทุกประเภท 

กระบวนการกู้คืนจากความเสียหายในศูนย์ข้อมูล

ในกรณีที่เกิดภัยธรรมชาติบางประเภท อุปกรณ์ที่เหมาะสมสามารถปกป้องศูนย์ข้อมูลของคุณ และมีส่วนช่วยให้มีกระบวนการกู้คืนจากความเสียหายที่รวดเร็ว ตัวอย่างเช่น เครื่องมือดับเพลิงอัตโนมัติช่วยให้อุปกรณ์และข้อมูลรอดผ่านเปลวไฟ และแหล่งไฟฟ้าสำรองสนับสนุนความต่อเนื่องของธุรกิจในกรณีที่ไฟฟ้าดับ ในทำนองเดียวกัน ศูนย์ข้อมูล AWS มีระบบนวัตกรรมที่ให้การปกป้องจากความเสี่ยงที่มนุษย์สร้างขึ้นและความเสี่ยงตามธรรมชาติ

การจำลองระบบเสมือน 

ธุรกิจสำรองข้อมูลและการดำเนินการของตนโดยใช้ Virtual Machine (VM) นอกสถานที่ซึ่งไม่ได้รับผลกระทบจากความเสียหายทางกายภาพ เมื่อการจำลองระบบเสมือนเป็นส่วนหนึ่งในแผนกระบวนการกู้คืนจากความเสียหาย ธุรกิจจะทำให้กระบวนการบางอย่างเป็นอัตโนมัติ จึงกู้การทำงานจากภัยธรรมชาติได้เร็วขึ้น การถ่ายโอนข้อมูลและเวิร์กโหลดไปยัง VM เช่น Amazon Elastic Compute Cloud (Amazon EC2) อย่างต่อเนื่องเป็นสิ่งสำคัญเพื่อให้การจำลองระบบเสมือนมีประสิทธิผล 

บริการกระบวนการกู้คืนจากความเสียหาย

บริการกระบวนการกู้คืนจากความเสียหาย เช่น AWS Elastic Disaster Recovery สามารถย้ายการประมวผลคอมพิวเตอร์และการดำเนินธุรกิจที่สำคัญของบริษัทไปยังบริการระบบคลาวด์ของตนเองในกรณีที่เกิดความเสียหายได้ ดังนั้น การดำเนินธุรกิจตามปกติจึงดำเนินต่อไปจากตำแหน่งที่ตั้งของผู้ให้บริการ แม้ว่าเซิร์ฟเวอร์ในองค์กรจะหยุดทำงานก็ตาม นอกจากนี้กระบวนการกู้คืนจากความเสียหายที่ยืดหยุ่นยังให้การปกป้องจากการที่ Region ในระบบคลาวด์หยุดทำงานด้วย 

สถานที่ทำงานสำรอง

ในกรณีที่เกิดภัยธรรมชาติ บริษัทย้ายการทำงานไปยังสถานที่ตั้งแหล่งอื่นที่ไม่ค่อยได้ใช้งาน ซึ่งเรียกว่าสถานที่ทำงานสำรอง (cold site) ด้วยวิธีนี้ พนักงานจะมีสถานที่ทำงาน และการทำงานของธุรกิจก็สามารถดำเนินต่อไปได้ตามปกติ กระบวนการกู้คืนจากความเสียหายประเภทนี้ไม่ได้ปกป้องหรือกู้คืนข้อมูลที่สำคัญ ดังนั้นจึงต้องใช้วิธีการกู้คืนจากความเสียหายอื่นร่วมกับวิธีนี้    

AWS สามารถช่วยในกระบวนการกู้คืนจากความเสียหายได้อย่างไร

Elastic Disaster Recovery คือบริการกระบวนการกู้คืนจากความเสียหายที่ลดเวลาหยุดทำงานและการสูญเสียข้อมูลให้เกิดขึ้นน้อยที่สุดด้วยการกู้คืนแอปพลิเคชันในองค์กร บริการนี้สามารถลด RPO ของคุณเหลือเพียงไม่กี่วินาที และ RTO เหลือเพียงไม่กี่นาที คุณสามารถกู้คืนการดำเนินการหลังเกิดเหตุการณ์ที่ไม่คาดคิดอย่างรวดเร็ว เช่น ปัญหาด้านซอฟต์แวร์หรือการทำงานล้มเหลวของฮาร์ดแวร์ในศูนย์ข้อมูล นอกจากนี้ยังเป็นโซลูชันที่ยืดหยุ่น คุณจึงสามารถเพิ่มหรือลบเซิร์ฟเซอร์ซ้ำและทดสอบแอปพลิเคชันต่าง ๆ ได้โดยไม่ต้องมีชุดทักษะเฉพาะทาง

กระบวนการกู้คืนจากความเสียหายที่ยืดหยุ่นรวมถึงประโยชน์ต่อไปนี้:

  • ลดค่าใช้จ่ายโดยการนำทรัพยากรในไซต์การกู้คืนข้อมูลที่ไม่ได้ใช้งานออกไป คุณจึงชำระค่าบริการสำหรับไซต์กระบวนการกู้คืนจากความเสียหายทั้งหมดของคุณเฉพาะเมื่อจำเป็นเท่านั้น
  • แปลงแอปพลิเคชันบนระบบคลาวด์ให้ทำงานแบบเนทีฟบน AWS
  • กู้คืนแอปพลิเคชันให้กลับสู่สถานะล่าสุดหรือจากช่วงเวลาก่อนหน้าได้ภายในไม่กี่นาทีในกรณีที่เกิดเหตุการณ์ด้านความปลอดภัย

เริ่มต้นใช้กระบวนการกู้คืนจากความเสียหายบน AWS ด้วยการสร้างบัญชี AWS วันนี้ 

ขั้นตอนต่อไปบน AWS

ดูแหล่งข้อมูลที่เกี่ยวกับผลิตภัณฑ์เพิ่มเติม
เรียนรู้เพิ่มเติมเกี่ยวกับบริการกระบวนการกู้คืนจากความเสียหาย 
ลงชื่อสมัครใช้บัญชีฟรี

รับสิทธิ์การเข้าถึง AWS Free Tier ได้ทันที 

ลงชื่อสมัครใช้งาน 
เริ่มต้นสร้างใน Console

เริ่มต้นสร้างใน AWS Management Console

ลงชื่อเข้าใช้