Data Augmentation (การเสริมข้อมูล) คืออะไร

Data Augmentation (การเสริมข้อมูล) เป็นกระบวนการสร้างข้อมูลใหม่ปลอมจากข้อมูลที่มีอยู่ ซึ่งหลัก ๆ แล้วเพื่อฝึกโมเดลแมชชีนเลิร์นนิง (ML) ใหม่ โมเดล ML ต้องการชุดข้อมูลขนาดใหญ่และหลากหลายสำหรับการฝึกเบื้องต้น แต่การจัดหาชุดข้อมูลในโลกแห่งความเป็นจริงที่หลากหลายให้มากเพียงพออาจจะเป็นเรื่องท้าทายเพราะมี Data Silo, กฎระเบียบ และข้อจำกัดอื่น ๆ Data Augmentation จะเพิ่มชุดข้อมูลโดยทำการเปลี่ยนแปลงข้อมูลต้นฉบับเล็กน้อย ขณะนี้โซลูชันปัญญาประดิษฐ์ (AI) ช่วยสร้างนั้นได้ถูกนำมาใช้เพื่อเพิ่มข้อมูลคุณภาพสูงและความรวดเร็วในอุตสาหกรรมต่าง ๆ มากมาย

อ่านเกี่ยวกับแมชชีนเลิร์นนิง

อ่านเกี่ยวกับ AI ช่วยสร้าง

เหตุใดการเสริมข้อมูลจึงสำคัญ

แบบจำลองดีปเลิร์นนิง อาศัยข้อมูลที่หลากหลายเป็นจำนวนมากเพื่อพัฒนาการคาดการณ์ที่ถูกต้องในบริบทต่างๆ การเสริมข้อมูลจะเสริมสร้างรูปแบบข้อมูลที่ช่วยให้แบบจำลองสามารถปรับปรุงความถูกต้องของการคาดการณ์ได้ ข้อมูลเสริมมีความสำคัญอย่างมากในการฝึกอบรม

นี่คือประโยชน์บางประการของการเสริมข้อมูล

ประสิทธิภาพของแบบจำลองที่เพิ่มขึ้น

เทคนิคการเสริมข้อมูลช่วยเสริมสร้างชุดข้อมูลให้มีข้อมูลมากยิ่งขึ้นด้วยการสร้างรูปแบบต่างๆ ของข้อมูลที่มีอยู่เดิม ซึ่งเทคนิคนี้ให้ชุดข้อมูลที่ใหญ่ยิ่งขึ้นสำหรับการฝึกอบรม และช่วยให้แบบจำลองพบเจอกับคุณสมบัติที่หลากหลายได้มากขึ้น ข้อมูลที่เพิ่มขึ้นช่วยให้แบบจำลองสามารถปรับตัวกับข้อมูลที่ไม่เคยพบมาก่อนได้ดียิ่วขึ้นและปรับปรุงประสิทธิภาพโดยรวมของแบบจำลองในสภาพแวดล้อมความเป็นจริง 

ลดการพึ่งพาด้านข้อมูล

การรวบรวมและการเตรียมการข้อมูลปริมาณมากสำหรับฝึกอบรมอาจมีค่าใช้จ่ายและเสียเวลา เทคนิคการเสริมข้อมูลช่วยเพิ่มประสิทธิภาพของชุดข้อมูลขนาดเล็ก และลดการพึ่งพาชุดข้อมูลขนาดใหญ่ในสภาพแวดล้อมการฝึกอบรมได้เป็นอย่างมาก คุณสามารถใช้ชุดข้อมูลขนาดเล็กเพื่อเสริมชุดด้วยจุดข้อมูลสังเคราะห์ได้

ยับยั้งความโอเวอร์ฟิตติ้งของข้อมูลการฝึกอบรม

การเสริมข้อมูลช่วยป้องกันไม่ให้เกิดโอเวอร์ฟิตติ้งเมื่อคุณทำการฝึกแบบจำลอง ML โอเวอร์ฟิตติ้งเป็นพฤติกรรมอันไม่พึงประสงค์ของ ML ที่แบบจำลองสามารถให้การคาดการณ์สำหรับข้อมูลในการฝึกได้อย่างแม่นยำ แต่ประสบปัญหาเมื่อพบกับข้อมูลใหม่ๆ หากฝึกสอนแบบจำลองด้วยชุดข้อมูลแคบๆ ML อาจเกิดภาวะโอเวอร์ฟิตติ้งและจะสามารถให้การคาดการณ์ได้แค่เฉพาะที่เกี่ยวข้องกับข้อมูลประเภทดังกล่าวเท่านั้น ในทางตรงกันข้าม การเสริมข้อมูลให้ชุดข้อมูลที่ใหญ่กว่าและครอบคลุมยิ่งกว่าในการฝึกอบรมแบบจำลอง ซึ่งจะทำให้ชุดการฝึกอบรมดูมีความไม่ซ้ำสำหรับดีปนิวรัลเน็ตเวิร์ก และป้องกันไม่ให้ระบบเรียนรู้ที่จะทำงานกับลักษณะเฉพาะเพียงลักษณะใดลักษณะหนึ่ง 

อ่านเกี่ยวกับโอเวอร์ฟิตติ้ง

อ่านเกี่ยวกับนิวรัลเน็ตเวิร์ก

ความเป็นส่วนตัวของข้อมูลที่ได้รับการปรับปรุง

หากคุณต้องการฝึกแบบจำลองดีปเลิร์นนิงเกี่ยวกับข้อมูลที่มีความละเอียดอ่อน คุณสามารถใช้เทคนิคการเสริมกับข้อมูลที่มีอยู่เพื่อสร้างข้อมูลสังเคราะห์ได้ ข้อมูลเสริมยังรักษาคุณสมบัติทางสถิติและน้ำหนักของข้อมูลอินพุตพร้อมกับปกป้องและจำกัดการเข้าถึงต้นฉบับ

กรณีการใช้งานของการเสริมข้อมูลมีอะไรบ้าง

การเสริมข้อมูลได้นำเสนอวิธีการประยุกต์ใช้หลายรูปแบบในอุตสาหกรรมต่างๆ ซึ่งช่วยปรับปรุงประสิทธิภาพของแบบจำลอง ML ในหลายๆ ภาคส่วน

การดูแลสุขภาพ

การเสริมข้อมูลเป็นเทคโนโลยีที่มีประโยชน์ในการถ่ายภาพทางการแพทย์ เพราะเป็นเทคโนโลยีที่ช่วยปรับปรุงแบบจำลองการวินิจฉัยซึ่งตรวจจับ แยกแยะ และวินิจฉัยโรคจากภาพ การสร้างภาพเสริมจะให้ข้อมูลเพิ่มเติมสำหรับฝึกอบรมปก่แบบจำลอง โดยเฉพาะอย่างยิ่งกับโรคหายากที่ขาดความหลากหลายของแหล่งข้อมูล การผลิตและใช้ข้อมูลผู้ป่วยสังเคราะห์จะช่วยพัฒนาการวิจัยทางการแพทย์ไปพร้อมกับปฏิบัติตามข้อควรพิจารณาด้านความเป็นส่วนตัวของข้อมูลทั้งหมด 

การเงิน

การเสริมช่วยสร้างตัวอย่างแบบสังเคราะห์ของการฉ้อโกง ทำให้แบบจำลองสามารถฝึกฝนเพื่อตรวจจับการฉ้อโกงได้อย่างแม่นยำยิ่งขึ้นในสถานการณ์ความเป็นจริง กลุ่มข้อมูลการฝึกอบรมที่ใหญ่ขึ้นจะช่วยในสถานการณ์ประเมินความเสี่ยง โดยเพิ่มศักยภาพของแบบจำลองดีปเลิร์นนิงเพื่อประเมินความเสี่ยงอย่างแม่นยำและคาดการณ์แนวโน้มในอนาคต 

การผลิต

อุตสาหกรรมการผลิตใช้แบบจำลอง ML เพื่อระบุหาข้อบกพร่องที่มองเห็นได้ในผลิตภัณฑ์ แบบจำลองสามารถปรับปรุงความสามารถในการจดจำภาพและค้นหาข้อบกพร่องที่อาจเกิดขึ้นได้ด้วยการเสริมข้อมูลในความเป็นจริงด้วยภาพเสริม กลยุทธ์นี้ยังช่วยลดโอกาสในการจัดส่งชิ้นงานที่เสียหายหรือมีข้อบกพร่องไปยังโรงงานและสายการผลิต

การค้าปลีก

สภาพแวดล้อมการค้าปลีกใช้แบบจำลองเพื่อระบุผลิตภัณฑ์และกำหนดผลิตภัณฑ์ตามหมวดหมู่โดยอิงจากปัจจัยด้านภาพ การเสริมข้อมูลสามารถสร้างข้อมูลสังเคราะห์แบบต่างๆ ของภาพผลิตภัณฑ์ และสร้างชุดการฝึกอบรมที่มีความหลากหลายมากยิ่งขึ้นในด้านของสภาพแสง พื้นหลังภาพ และมุมของผลิตภัณฑ์

การเสริมข้อมูลทำงานอย่างไร

การเสริมข้อมูลจะแปลง แก้ไข หรือดัดแปลงข้อมูลที่มีอยู่เพื่อสร้างรูปแบบต่างๆ ลำดับต่อไปคือภาพรวมของกระบวนการ

การสำรวจชุดข้อมูล

ขั้นแรกของการเสริมข้อมูลคือการวิเคราะห์ที่มีอยู่และทำความเข้าใจลักษณะของชุดข้อมูลที่มีอยู่เดิม คุณสมบัติ เช่น ขนาดของภาพอินพุต การกระจายของข้อมูล หรือโครงสร้างข้อความ ทั้งหมดล้วนแล้วแต่ให้ข้อมูลบริบทเพิ่มเติมในการเสริม 

คุณสามารถเลือกเทคนิคการเสริมข้อมูลที่แตกต่างกันตามประเภทข้อมูลพื้นฐานและผลลัพธ์ที่ต้องการได้ ตัวอย่างเช่น การเสริมชุดข้อมูลด้วยภาพจำนวนมาก รวมถึงเพิ่มนอยส์ ปรับขนาด หรือครอบตัดภาพ อีกทางเลือกหนึ่งคือการเสริมชุดข้อมูลข้อความสำหรับประมวลผลภาษาธรรมชาติ (ซึ่งในที่นี้จะแทนคำใดๆ ที่มีความหมายพ้องกันหรือคำบรรยายที่ยกมาด้วยคำว่า NLP) 

อ่านเกี่ยวกับการประมวลผลภาษาธรรมชาติ

การเสริมข้อมูลที่มีอยู่เดิม

เมื่อคุณเลือกเทคนิคการเสริมข้อมูลที่เหมาะสมที่สุดสำหรับเป้าหมายที่คุณต้องการแล้ว คุณก็จะเริ่มใช้การแปลงแบบต่างๆ จุดของข้อมูลหรือตัวอย่างภาพในชุดข้อมูลจะถูกแปลงโดยใช้วิธีการเสริมที่คุณเลือก ซึ่งโดยให้ตัวอย่างเสริมแบบใหม่ๆ ที่หลากหลาย 

ระหว่างกระบวนการเสริม คุณจะต้องปฏิบัติตามติดป้ายกำกับเดียวกันเพื่อความสอดคล้องกันของข้อมูล เพื่อให้แน่ใจว่าข้อมูลสังเคราะห์มีป้ายกำกับเดียวกันและสอดคล้องกับข้อมูลต้นทาง

โดยปกติแล้ว คุณจะเป็นผู้ตรวจดูภาพสังเคราะห์เพื่อตรวจสอบว่าการแปลงประสบความสำเร็จหรือไม่ ขั้นตอนเพิ่มเติมที่ใช้มนุษย์นี้จะช่วยให้ข้อมูลมีคุณภาพที่สูงขึ้น 

การบูรณาการฟอร์มข้อมูล

ในขั้นถัดไป คุณจะได้รวมข้อมูลเสริมใหม่เข้ากับข้อมูลต้นฉบับ เพื่อสร้างชุดข้อมูลฝึกอบรมที่ใหญ่ขึ้นสำหรับแบบจำลอง ML คุณจะได้ใช้ชุดข้อมูลผสมของข้อมูลทั้งสองชนิดนี้ในระหว่างฝึกอบรมแบบจำลอง

คุณควรทราบว่าจุดของข้อมูลใหม่ที่สร้างขึ้นด้วยการเสริมข้อมูลสังเคราะห์จะมีความโน้มเอียงเหมือนกับข้อมูลอินพุตต้นฉบับ เพื่อป้องกันไม่ให้มีการถ่ายโอนความโน้มเอียงไปยังข้อมูลใหม่ ให้แก้ไขความโน้มเอียงใดๆ ในข้อมูลต้นฉบับก่อนเริ่มกระบวนการเสริมข้อมูล

เทคนิคการเสริมข้อมูลมีอะไรบ้าง

เทคนิคการเสริมข้อมูลจะแตกต่างกันไปตามแต่ละประเภทข้อมูลและบริบททางธุรกิจ

คอมพิวเตอร์วิทัศน์

การเสริมข้อมูลเป็นเทคนิคหลักในการทำงานด้านคอมพิวเตอร์วิทัศน์ โดยช่วยสร้างสื่อแสดงแทนข้อมูลที่หลากหลา ยและจัดการกับความไม่สมดุลของคลาสในชุดข้อมูลฝึกอบรม 

การใช้การเสริมแบบแรกๆ ในคอมพิวเตอร์วิทัศน์คือการเสริมตำแหน่ง กลยุทธ์นี้จะครอบตัด พลิก หรือหมุนภาพอินพุตเพื่อสร้างภาพเสริม การครอบตัดจะเปลี่ยนขนาดภาพหรือครอบตัดส่วนเล็กๆ ของภาพต้นฉบับเพื่อสร้างภาพใหม่ การหมุน พลิก และการเปลี่ยนขนาดจะเปลี่ยนรูปภาพต้นฉบับแบบสุ่ม ด้วยความน่าจะเป็นในการให้ภาพใหม่ที่กำหนด

อีกหนึ่งการใช้งานด้านการเสริมในคอมพิวเตอร์วิทัศน์คือการเสริมสี กลยุทธ์นี้จะปรับแต่งปัจจัยพื้นฐานของภาพที่ใช้ในการฝึกอบรม เช่น ความสว่าง ระดับความคมชัด หรือความอิ่มตัวของสี การแปลงภาพทั่วไปเหล่านี้จะเปลี่ยนเฉดสี สมดุลแสงเงา และการแยกระหว่างพื้นที่ที่มืดที่สุดและสว่างที่สุดของภาพเพื่อสร้างภาพเสริม

อ่านเกี่ยวกับคอมพิวเตอร์วิทัศน์

การเสริมข้อมูลเสียง

ไฟล์เสียง เช่น สิ่งบันทึกการพูด ก็เป็นแขนงทั่วไปที่คุณสามารถใช้การเสริมข้อมูลได้ การแปลงเสียงมักจะรวมถึงการเพิ่มเสียงรบกวนแบบสุ่มหรือเกาส์ลงในเสียงบางส่วน กรอเร่งบางส่วน เปลี่ยนความเร็วของบางส่วนด้วยอัตราที่กำหนด หรือเปลี่ยนแปลงระดับเสียง

การเสริมข้อมูลข้อความ

การเสริมข้อความเป็นเทคนิคการเสริมข้อมูลที่สำคัญของ NLP และส่วนอื่นๆ ของ ML ที่เกี่ยวข้องกับข้อความ การแปลงข้อมูลข้อความ ได้แก่ การสุ่มสลับประโยค การเปลี่ยนตำแหน่งของคำ แทนที่คำด้วยคำไวพจน์ที่ใกล้เคียง แทรกคำแบบสุ่ม และลบคำแบบสุ่ม

การถ่ายโอนแบบนิวรัล

การถ่ายโอนแบบนิวรัลเป็นรูปแบบขั้นสูงของการเสริมข้อมูลโดยแยกโครงสร้างภาพออกเป็นส่วนเล็กๆ และใช้ชุดของเลเยอร์ที่ซับซ้อนซึ่งแยกรูปแบบและบริบทของภาพ แล้วสร้างภาพจำนวนมากจากภาพเพียงภาพเดียว 

การฝึกอบรมกรณีที่มีคู่ปฏิปักษ์

การเปลี่ยนแปลงในระดับพิกเซลจะสร้างความท้าทายแก่แบบจำลอง ML บางตัวอย่างมีการเพิ่มชั้นของนอยส์ที่ไม่สามารถมองเห็นได้เหนือภาพเพื่อทดสอบความสามารถของแบบจำลองในการรับรู้ภาพที่อยู่ด้านล่าง กลยุทธ์นี้เป็นรูปแบบเชิงป้องกันของการเสริมข้อมูล โดยมุ่งเน้นไปที่การเข้าถึงที่ไม่ได้รับอนุญาตที่อาจเกิดขึ้นในโลกแห่งความเป็นจริง

บทบาทของ AI ช่วยสร้างในการเสริมข้อมูลคืออะไร

AI ช่วยสร้างมีความสำคัญในการเสริมข้อมูลเพราะช่วยอำนวยความสะดวกในการผลิตข้อมูลสังเคราะห์ อีกทั้งยังช่วยเพิ่มความหลากหลายของข้อมูล ทำให้การสร้างข้อมูลสมจริงไหลลื่นยิ่งขึ้น และรักษาความเป็นส่วนตัวของข้อมูล 

เครือข่ายปฏิปักษ์ช่วยสร้าง

เครือข่ายปฏิปักษ์ช่วยสร้าง (GAN) เป็นเฟรมเวิร์กของนิวรัลเน็ตเวิร์กเครือข่ายที่ทำงานแบบตรงข้ามกัน Generator จะสร้างตัวอย่างข้อมูลสังเคราะห์ จากนั้น Discriminator จะทำการแยกความแตกต่างระหว่างข้อมูลจริงและตัวอย่างสังเคราะห์

เมื่อเวลาผ่านไป GAN จะปรับปรุงเอาต์พุตของ Generator โดยมุ่งเน้นไปที่การหลอกตัว Discriminator ข้อมูลที่สามารถหลอก Discriminator ได้ถือว่าเป็นข้อมูลสังเคราะห์คุณภาพสูง ซึ่งทำการเสริมข้อมูลด้วยตัวอย่างที่มีความน่าเชื่อถือสูงที่เลียนแบบการกระจายข้อมูลของต้นฉบับได้อย่างแนบเนียน

ตัวเข้ารหัสอัตโนมัติแบบแปรผัน

ตัวเข้ารหัสอัตโนมัติแบบแปรผัน (VAE) เป็นนิวรัลเน็ตเวิร์กชนิดหนึ่งที่ช่วยเพิ่มขนาดตัวอย่างของข้อมูลหลัก และลดความจำเป็นในการรวบรวมข้อมูลที่กินเวลานาน VAE มีเครือข่ายที่เชื่อมต่อสองเครือข่าย ได้แก่ ตัวถอดรหัสและตัวเข้ารหัส ตัวเข้ารหัสจะรับภาพตัวอย่างและแปลเป็นสื่อแสดงแทนแบบตัวกลาง ตัวถอดรหัสรับสื่อแสดงแทนและสร้างภาพที่คล้ายคลึงกันตามความเข้าใจในตัวอย่างตั้งต้นของระบบเอง VAE มีประโยชน์อย่างยิ่งเพราะสามารถสร้างข้อมูลที่มีความคล้ายคลึงกับข้อมูลตัวอย่างอย่างมาก ซึ่งช่วยเพิ่มความหลากหลายพร้อมกับคงการกระจายข้อมูลดั้งเดิมเอาไว้

AWS สามารถสนับสนุนข้อกำหนดการเพิ่มข้อมูลของคุณได้อย่างไร

AI ช่วยสร้างบน Amazon Web Services (AWS) คือชุดเทคโนโลยีที่องค์กรทุกขนาดสามารถใช้เพื่อสร้างและปรับขนาดแอปพลิเคชัน AI ช่วยสร้างด้วยข้อมูลที่ปรับแต่งสำหรับกรณีการใช้งานที่กำหนดเอง คุณสามารถสร้างสรรค์สิ่งใหม่ ๆ ได้รวดเร็วยิ่งขึ้นด้วยความสามารถใหม่ ๆ ตัวเลือกโมเดลพื้นฐาน (FM) ชั้นนำของอุตสาหกรรม และโครงสร้างพื้นฐานที่คุ้มค่าที่สุด ต่อไปนี้คือสองตัวอย่างของบริการ AI ช่วยสร้างบน AWS

Amazon Bedrock เป็นบริการที่มีการจัดการเต็มรูปแบบซึ่งนำเสนอตัวเลือก FM ที่มีประสิทธิภาพสูงจากบริษัท AI ชั้นนำ คุณสามารถผสานการทำงานและปรับใช้ความสามารถด้าน AI ช่วยสร้างสำหรับการเพิ่มข้อมูลได้อย่างปลอดภัย โดยไม่ต้องจัดการโครงสร้างพื้นฐาน

Amazon Rekognition เป็นบริการ AI ที่มีการจัดการเต็มรูปแบบซึ่งมีความสามารถด้านคอมพิวเตอร์วิชันที่ได้รับการฝึกล่วงหน้าและสามารถปรับแต่งได้ เพื่อดึงข้อมูลและข้อมูลเชิงลึกจากรูปภาพและวิดีโอของคุณ การพัฒนาแบบจำลองแบบกำหนดเองเพื่อวิเคราะห์ภาพถือเป็นภารกิจสำคัญที่ต้องใช้เวลา ความเชี่ยวชาญ และทรัพยากร ในหลายครั้งที่ต้องใช้รูปภาพที่ติดป้ายกำกับด้วยมือจำนวนหลายพันหรือหลายหมื่นรูปเพื่อทำให้โมเดลมีข้อมูลที่เพียงพอต่อการตัดสินใจได้อย่างแม่นยำ 

เมื่อใช้ Amazon Rekognition Custom Labels จะมีการเสริมข้อมูลต่าง ๆ สำหรับการฝึกโมเดล รวมถึงการครอบตัดรูปภาพแบบสุ่ม การคลาดเคลื่อนของสี และ Gaussian Noise (สัญญาณรบกวน) แทนที่จะอัปโหลดรูปภาพหลายพันรายการ คุณต้องอัปโหลดรูปภาพการฝึกชุดเล็ก ๆ เท่านั้น (โดยทั่วไปคือไม่กี่ร้อยภาพหรือน้อยกว่านั้น) สำหรับกรณีการใช้งานของคุณไปยังคอนโซลที่ใช้งานง่าย

เริ่มต้นใช้งานการเพิ่มข้อมูลบน AWS ด้วยการสร้างบัญชีวันนี้

ขั้นตอนถัดไปบน AWS

ลงชื่อสมัครใช้บัญชีฟรี

รับสิทธิ์การเข้าถึง AWS Free Tier ได้ทันที

ลงชื่อสมัครใช้งาน 
เริ่มต้นการสร้างในคอนโซล

เริ่มต้นสร้างในคอนโซลการจัดการของ AWS

ลงชื่อเข้าใช้