Amazon DevOps Guru

บริการปฏิบัติการบนระบบคลาวด์ที่ขับเคลื่อนด้วย ML เพื่อปรับปรุงความพร้อมใช้งานของแอปพลิเคชัน

Amazon DevOps Guru คือบริการที่ขับเคลื่อนโดยแมชชีนเลิร์นนิง (ML) ที่ออกแบบมาเพื่อให้สามารถปรับปรุงประสิทธิภาพในการดำเนินงานและความพร้อมใช้งานของแอปพลิเคชันได้ง่าย DevOps Guru ช่วยตรวจจับพฤติกรรมที่แตกต่างจากรูปแบบการทำงานปกติเพื่อให้คุณสามารถระบุปัญหาด้านการดำเนินงานได้ก่อนที่จะส่งผลกระทบต่อลูกค้า

DevOps Guru ใช้โมเดล ML ที่ได้เรียนรู้ข้อมูลจาก Amazon.com และความเป็นเลิศด้านการดำเนินงานของ AWS มาเป็นเวลาหลายปีเพื่อระบุพฤติกรรมของแอปพลิเคชันที่ไม่ปกติ (ตัวอย่างเช่น เวลาแฝง อัตราข้อผิดพลาด การจำกัดทรัพยากรเพิ่มขึ้น และอื่นๆ) และยังช่วยแสดงปัญหาสำคัญที่อาจนำไปสู่การหยุดทำงานหรือการหยุดชะงักของบริการที่อาจเกิดขึ้นได้ เมื่อ DevOps Guru ระบุปัญหาสำคัญได้แล้ว จะดำเนินการส่งการแจ้งเตือนให้โดยอัตโนมัติ ทั้งยังให้ผลสรุปของความผิดปกติที่เกี่ยวข้อง สาเหตุหลักของปัญหาที่เป็นไปได้ และบริบทที่ระบุว่าปัญหาเกิดขึ้นเมื่อใดและที่ไหน นอกจากนี้ DevOps Guru ยังช่วยให้คำแนะนำถึงวิธีแก้ไขปัญหาด้วยหากทำได้

ด้วยการปรับใช้ในคลิกเดียวทำให้ DevOps Guru สามารถนำเข้าข้อมูลการดำเนินงานของแอปพลิเคชัน AWS ของคุณได้โดยอัตโนมัติ และยังให้แดชบอร์ดแบบเดี่ยวที่แสดงข้อมูลภาพของปัญหาในข้อมูลการดำเนินงานของคุณ คุณสามารถเริ่มใช้งานได้โดยการเปิดใช้ DevOps Guru ให้กับทรัพยากรทั้งหมดในบัญชี AWS หรือทรัพยากรในสแตก AWS CloudFormation ของคุณ หรือทรัพยากรที่รวมเป็นกลุ่มเดียวกันด้วยแท็กของ AWS โดยไม่จำเป็นต้องตั้งค่าด้วยตัวเองหรือมีความเชี่ยวชาญใดๆ ในเรื่อง ML เลย

ชั่วโมงทรัพยากร AWS ฟรี 7,200 ชั่วโมง

แต่ละรายการสำหรับกลุ่มทรัพยากร A และ B

ต่อเดือนเป็นเวลา 3 เดือนด้วย AWS Free Tier

ประโยชน์

ตรวจจับปัญหา

ตรวจจับปัญหาด้านการดำเนินงานโดยอัตโนมัติ

เมื่อใช้ ML Amazon DevOps Guru จะรวบรวมและวิเคราะห์ข้อมูลเช่น ตัววัด บันทึก เหตุการณ์ และพฤติกรรมของแอปพลิเคชันที่ไม่ปกติจากรูปแบบการดำเนินงานปกติโดยอัตโนมัติ บริการถูกออกแบบมาให้ตรวจจับและแจ้งเตือนปัญหาและความเสี่ยงด้านการดำเนินงาน เช่น ทรัพยากรที่กำลังจะหมด การเปลี่ยนแปลงของโค้ดและการกำหนดค่าที่อาจทำให้เกิดการหยุดทำงานได้ การรั่วไหลของหน่วยความจำ ความสามารถในการประมวลผลที่ไม่เพียงพอ และการใช้ฐานข้อมูลอินพุต/เอาต์พุต (I/O) มากเกินไปโดยอัตโนมัติ

แก้ไขปัญหา

แก้ไขปัญหาได้อย่างรวดเร็วด้วยข้อมูลเชิงลึกซึ่งขับเคลื่อนด้วย ML

Amazon DevOps Guru ช่วยลดเวลาในการระบุและแก้ไขสาเหตุหลักของปัญหาด้วยการเชื่อมโยงความสัมพันธ์ระหว่างพฤติกรรมที่ไม่ปกติและเหตุการณ์ด้านการดำเนินงาน เมื่อปัญหาเกิดขึ้น DevOps Guru ได้ถูกออกแบบมาเพื่อสร้างข้อมูลเชิงลึกพร้อมด้วยผลสรุปของความผิดปกติที่เกี่ยวข้องและข้อมูลเชิงบริบทเกี่ยวกับปัญหา ทั้งยังช่วยให้คำแนะนำถึงการดำเนินการที่สามารถทำได้เพื่อแก้ไขปัญหาด้วยหากทำได้

ปรับขนาด

ปรับขนาดและรักษาความพร้อมใช้งานไว้ได้อย่างง่ายดาย

Amazon DevOps Guru ช่วยคุณประหยัดเวลาและไม่ต้องเปลืองแรงในการอัปเดตกฎและการแจ้งเตือนแบบคงที่ด้วยตนเอง ดังนั้นคุณจึงสามารถตรวจสอบแอปพลิเคชันที่ซับซ้อนและพัฒนาอย่างต่อเนื่องได้อย่างมีประสิทธิภาพ เมื่อคุณโยกย้ายหรือปรับใช้บริการใหม่ของ AWS DevOps Guru จะวิเคราะห์ตัววัด บันทึก และเหตุการณ์ของบริการนั้นให้โดยอัตโนมัติ จากนั้นจึงสร้างข้อมูลเชิงลึกที่ช่วยให้คุณปรับตัวเข้ากับพฤติกรรมที่มีการเปลี่ยนแปลงและสถาปัตยกรรมระบบที่พัฒนาไปอย่างต่อเนื่องได้อย่างง่าย

ลดสัญญาณรบกวน

ลดสัญญาณรบกวนและความล้าจากสัญญาณเตือน


Amazon DevOps Guru ช่วยนักพัฒนาและผู้ปฏิบัติงานทาง IT ในการลดสัญญาณรบกวนและเอาชนะความล้าเนื่องจากสัญญาณเตือนด้วยการใช้โมเดล ML ที่มีการฝึกฝนไว้ล่วงหน้าเพื่อเชื่อมโยงและจัดกลุ่มความผิดปกติที่เกี่ยวข้องกัน ทั้งยังแสดงการแจ้งเตือนที่สำคัญที่สุดให้อีกด้วย DevOps Guru ช่วยให้คุณสามารถลดความจำเป็นในการจัดการเครื่องมือและการแจ้งเตือนการตรวจสอบหลายรายการลงได้ ซึ่งหมายความว่าคุณสามารถมุ่งเน้นไปที่สาเหตุหลักของปัญหาและวิธีแก้ไขได้

วิธีการทำงาน

วิธีการทำงานของ DevOps Guru
รับข้อมูลเชิงลึกของการดำเนินงาน


รับข้อมูลเชิงลึกของการดำเนินงานด้วย Amazon DevOps Guru

กรณีใช้งาน

ปรับปรุงประสิทธิภาพการดำเนินงานและความพร้อมใช้งาน

ป้องกันเหตุการณ์ผิดปกติในการดำเนินงานก่อนเกิดขึ้นจริง Amazon DevOps Guru ออกแบบมาเพื่อแสดงผลการค้นหาที่มีความรุนแรงระดับต่ำและปานกลางซึ่งส่งผลกระทบต่อความน่าเชื่อถือของแอปพลิเคชันได้เมื่อเวลาผ่านไป เช่น การถึงขีดจำกัดของกลุ่มการปรับขนาดอัตโนมัติ (Auto-Scaling), การเปลี่ยนแปลงของรูปแบบเวลาแฝง หรือโวลุ่มของการเรียก API ที่เพิ่มขึ้น

ค้นพบทรัพยากรและตัววัดแบบใหม่ได้ในแบบไดนามิก

เมื่อแอปพลิเคชันของคุณเริ่มพัฒนาและมีการเพิ่มทรัพยากรใหม่ที่รองรับเข้ามา Amazon DevOps Guru จึงได้รับการออกแบบให้เรียนรู้รูปแบบของตัววัดและการแจ้งเตือนแบบใหม่แต่ละรายการที่มีการแจ้งเตือนปัญหาด้านการดำเนินงานล่วงหน้า ไม่จำเป็นต้องอัปเดตหรือแก้ไขการแจ้งเตือนที่มีการกำหนดค่าอย่างไม่ถูกต้องอีกต่อไป เพราะ DevOps Guru จะนำเข้าตัววัดจากทรัพยากรเหล่านี้และจำแนกให้โดยอัตโนมัติ

ลดเวลา mean-time-to-recovery (เวลาเฉลี่ยในการกู้คืน)

วินิจฉัยและแก้ไขปัญหาสำหรับทรัพยากร AWS ซึ่งมีฐานข้อมูลเชิงสัมพันธ์ได้อย่างรวดเร็ว เช่น การใช้ทรัพยากรมากเกินไป หรือพฤติกรรมที่ไม่เหมาะสมของการสืบค้น SQL บางอย่างด้วยข้อมูลเชิงลึกด้านการดำเนินงานของ DevOps Guru ข้อมูลเชิงลึกเหล่านี้จะลดเวลาเฉลี่ยในการกู้คืน (MTTR) ด้วยการใช้ข้อมูลที่เกี่ยวข้องกับทรัพยากรที่ได้รับผลกระทบและความผิดปกที่เกี่ยวข้อง และยังให้คำแนะนำด้วยข้อมูลเชิงบริบท เช่น บันทึก และเหตุการณ์ที่เกี่ยวข้อง

การจัดการทรัพยากรเชิงรุก

DevOps Guru ช่วยให้คุณสามารถระบุได้ว่าทรัพยากรที่สามารถหมดได้ เช่น หน่วยความจำ CPU และพื้นที่ว่างของดิสก์จะเกินความจุที่เตรียมใช้งานเมื่อใด DevOps Guru จะนำเข้าและวิเคราะห์ทรัพยากรรวมถึงแอปพลิเคชันที่ทำงานบน AWS อย่างต่อเนื่อง และช่วยคุณหลีกเลี่ยงการหยุดทำงานที่กำลังจะเกิดขึ้นได้ด้วยการสร้างการแจ้งเตือนในแดชบอร์ดที่มีสัญญาณรบกวนต่ำ

ลูกค้า

HCL Technologies
“เรามักมองหาวิธีในการลดเวลาที่ทีมของเราต้องใช้เพื่อแก้ไขปัญหาด้านการดำเนินงานอยู่เสมอ และตอนนี้เรากำลังใช้ Amazon DevOps Guru และใช้ประโยชน์จากข้อมูลเชิงลึกซึ่งขับเคลื่อนด้วย ML เพื่อช่วยเราในการระบุ เชื่อมโยง และแก้ไขปัญหาด้านการดำเนินงานได้อย่างรวดเร็ว ข้อมูลเชิงลึกจาก Amazon DevOps Guru ช่วยให้ทีมของเราสามารถค้นหาปัญหาได้อย่างรวดเร็วโดยไม่ต้องเริ่มต้นจากศูนย์ในการพยายามหาสาเหตุหลักของปัญหา ทีม IT ของเราสามารถลด MTTR ได้อย่างมาก และช่วยประหยัดเวลาในการแก้ปัญหาได้หลายชั่วโมง ทั้งยังสามารถรับประกันได้ว่าลูกค้าจะได้รับประสบการณ์ผู้ใช้ปลายทางที่ดีที่สุดเท่าที่สามารถทำได้อีกด้วย”

Anchal Gupta หัวหน้าฝ่ายเทคนิคระดับอาวุโสและ DevOps ของ HCL

Thomson Reuters
“ประสบการณ์ใช้งานและความพึงพอใจของลูกค้าคือสิ่งสำคัญที่สุดของเรา เมื่อได้รับแหล่งของการแจ้งเตือนและติดตามเหตุการณ์หลายแห่ง อาจก่อให้เกิดความท้าทายและต้องใช้เวลามากในการกรองเสียงรบกวนเพื่อระบุเหตุการณ์ผิดปกติที่ส่งผลกระทบต่อลูกค้า แต่ด้วย Amazon DevOps Guru เราสามารถใช้ประโยชน์จากข้อมูลเชิงลึกซึ่งขับเคลื่อนด้วย ML ที่ให้เส้นทางในการดำเนินการที่ชัดเจนสำหรับการลดเหตุการณ์เหล่านั้น และในหลายๆ กรณีก็สามารถจัดการกับปัญหาที่ส่งผลกระทบต่อลูกค้าของเราได้อีกด้วย การผสานรวมของ Amazon DevOps Guru กับ PagerDuty ยังให้เส้นทางตรงในการส่งมอบคำแนะนำให้กับบุคคลที่ถูกต้องในเวลาที่เหมาะสมได้อย่างรวดเร็วและมีประสิทธิภาพ และเราคาดหวังผลลัพธ์ซึ่งเป็นการลดเวลาในการหยุดการดำเนินงานได้เป็นอย่างมากอีกด้วย”

Steve Thoennes ผู้อำนวยการฝ่ายโครงสร้างพื้นฐานสำหรับการโฮสต์พอร์ตโฟลิโอของ Thomson Reuters

605.tv
“เรามีบัญชี AWS หลายสิบบัญชีและทรัพยากรกว่าหลายหมื่นรายการที่ต้องตรวจสอบ แม้จะมี Infrastructure as Code และการสร้างการแจ้งเตือนแบบไดนามิคสำหรับบริการเหล่านี้ แต่การจัดการและเชื่อมโยงตัววัดเพื่อแก้ไขปัญหาได้อย่างรวดเร็วนั้นก็เป็นเรื่องยากอยู่ดี แต่ด้วย Amazon DevOps Guru เราจึงมั่นใจว่าการเตือนและการแจ้งเตือนที่เราได้รับจากตัววัดที่ขับเคลื่อนโดย ML ซึ่งเชื่อมโยงกันในหลายๆ บริการนั้นจะมีความแม่นยำอยู่เสมอ การผสานรวม Amazon DevOps Guru จะใช้เวลาในการปรับใช้เพียงไม่กี่นาที แถมยังผสานรวมกับสแตก AWS CloudFormation นับพันรายการของเราได้อย่างง่ายดายอีกด้วย Amazon DevOps Guru ได้ให้ข้อมูลเชิงลึกที่ช่วยเราในการมุ่งเน้นไปที่แผนงานโครงสร้างพื้นฐานของเรา”

Jared Williams ผู้อำนวยการฝ่าย DevOps ของ 605.tv

คู่ค้า

Atlassian
"Atlassian มีความยินดีที่ลูกค้าของเรากำลังปรับใช้กลยุทธ์ AIOps โดยใช้ Amazon DevOps Guru เพื่อจัดการประสิทธิภาพการดำเนินงานของแอปพลิเคชันบนระบบคลาวด์ การผสานรวมการจัดการบริการ Opsgenie และ Jira ใหม่ของเราช่วยให้ทีมที่เหมาะสมจะได้รับแจ้งเตือนทันทีที่ Amazon DevOps Guru ตรวจพบปัญหาที่อาจเกิดขึ้นและจัดลำดับความสำคัญของปัญหาตามความรุนแรงของเหตุการณ์โดยใช้ ML การผสานรวมนี้สามารถรับประกันได้ว่าทุกทีมสามารถตอบสนองได้อย่างรวดเร็ว แก้ปัญหาโดยใช้การแนะนำซึ่งขับเคลื่อนโดย ML และเรียนรู้จากทุกเหตุการณ์”

Emel Dogrusoz หัวหน้าฝ่ายผลิตภัณฑ์ Opsgenie ของ Atlassian

เรียนรู้วิธีที่คุณสามารถส่งมอบข้อมูลเชิงลึกด้านการดำเนินงานให้กับทีมปฏิบัติการได้โดยตรงด้วยการผสานรวม Amazon DevOps Guru กับ Atlassian Opsgenie
PagerDuty
"PagerDuty กำลังสร้างความร่วมมือกับ AWS ให้มีความลึกซึ้งยิ่งขึ้นด้วยการผสานรวมกับ Amazon DevOps Guru รูปแบบใหม่ แพลตฟอร์มการจัดการด้านการดำเนินงานดิจิทัลของ PagerDuty ถูกสร้างขึ้นมาเพื่อขับเคลื่อนการปรับเปลี่ยนไปสู่วัฒนธรรม DevOps และเรามีความยินดีที่ได้ดำเนินความมุ่งมั่นนี้ต่อไปกับการผสานรวม การควบคุมความสามารถของ ML ของ DevOps Guru ทำให้ PagerDuty สามารถให้ความสามารถ Signal-to-action แบบเรียลไทม์แก่ลูกค้าร่วมของเราได้มากขึ้น ด้วยการนำเข้าข้อมูลของ Amazon Simple Notification Service (SNS) ของ PagerDuty ทำให้ลูกค้า AWS สามารถดำเนินการกับปัญหาด้านการดำเนินงานได้แบบเรียลไทม์ก่อนที่จะเกิดการหยุดทำงานซึ่งส่งผลกระทบต่อลูกค้า” 

Jonathan Rende, SVP ฝ่ายผลิตภัณฑ์ของ PagerDuty

ดูเพิ่มเติมเกี่ยวกับการส่งมอบข้อมูลเชิงลึกของการดำเนินงานซึ่งขับเคลื่อนโดย ML ให้กับทีมปฏิบัติการผ่าน PagerDuty และ Amazon DevOps Guru

โพสต์บล็อกและบทความ

devops guru 1a

ใหม่- Amazon DevOps Guru ช่วยระบุข้อผิดพลาดและการแก้ไขแอปพลิเคชัน

ธันวาคม 2020

Harunobu Kameda

อ่านบล็อก »

devops guru 2

กำหนดค่า Amazon DevOps Guru ในหลายบัญชีและหลาย Region ได้อย่างง่ายดายโดยใช้ AWS CloudFormation StackSets

ธันวาคม 2020

Nikunj Vaidya และ Nuatu Tseggai

อ่านบล็อก »

devops guru reinvent thumbnail

AWS re:Invent 2020: ปรับปรุงความพร้อมใช้งานของแอปพลิเคชันด้วยข้อมูลเชิงลึกซึ่งขับเคลื่อนด้วย ML โดยใช้ Amazon DevOps Guru

ธันวาคม 2020

Jacob Sullivan

ดูการสัมมนาผ่านเว็บ »

devops guru 4

Amazon DevOps Guru ได้รับการขับเคลื่อนโดยโมเดล ML ที่ผ่านการฝึกฝนซึ่งเข้ารหัสความเป็นเลิศด้านการดำเนินงาน

กุมภาพันธ์ 2020

Caner Turkmen, Ravi Turlapati และ Tim Januschowski

อ่านบล็อก »

การตรวจสอบโค้ดโดยอัตโนมัติ

การตรวจสอบโค้ดโดยอัตโนมัติ
ตรวจพบปัญหาเกี่ยวกับโค้ดได้เร็วขึ้นตั้งแต่เนิ่นๆ ด้วย Amazon CodeGuru

คุณสมบัติต่างๆ ของ Amazon DevOps Guru
ดูคุณสมบัติต่างๆ ของผลิตภัณฑ์

ปรับปรุงประสิทธิภาพการดำเนินงานและความพร้อมใช้งานของแอปพลิเคชันของคุณได้อย่างง่ายดาย

เรียนรู้เพิ่มเติม 
ลงชื่อสมัครใช้บัญชีฟรี
ลงชื่อสมัครใช้บัญชีฟรี

รับสิทธิ์การเข้าถึง AWS Free Tier ได้ทันที 

ลงชื่อสมัครใช้งาน 
เริ่มต้นสร้างใน Console
เริ่มต้นสร้างใน Console

เริ่มต้นสร้างด้วย Amazon DevOps Guru ใน AWS Management Console

ลงชื่อเข้าใช้