ข้ามไปที่เนื้อหาหลัก

แมชชีนเลิร์นนิง

แมชชีนเลิร์นนิงคืออะไร การเรียนรู้ของเครื่องในคำง่ายๆ คืออะไร อะไรคือความแตกต่างระหว่างแมชชีนเลิร์นนิงกับปัญญาประดิษฐ์ ความแตกต่างระหว่างแมชชีนเลิร์นนิงกับดีปเลิร์นนิงคืออะไร แมชชีนเลิร์นนิงทำงานอย่างไร ประโยชน์ของการเรียนรู้ของเครื่องมีอะไรบ้าง กรณีใช้งานแมชชีนเลิร์นนิงยอดนิยม 7 กรณี อัลกอริทึมของแมชชีนเลิร์นนิงมีกี่ประเภท รูปแบบแมชชีนเลิร์นนิงเป็นแบบเชิงกำหนดหรือไม่ คุณจะนำแมชชีนเลิร์นนิงไปปรับใช้ในองค์กรของคุณได้อย่างไร ความท้าทายในการปรับใช้แมชชีนเลิร์นนิงมีอะไรบ้าง ฝึกแมชชีนเลิร์นนิงสำหรับผู้เริ่มต้น แมชชีนเลิร์นนิงของ AWS สามารถช่วยได้อย่างไร

แมชชีนเลิร์นนิงคืออะไร

แมชชีนเลิร์นนิงเป็นปัญญาประดิษฐ์ประเภทหนึ่งที่ทำงานวิเคราะห์ข้อมูลโดยไม่มีคำแนะนำที่ชัดเจน เทคโนโลยีแมชชีนเลิร์นนิงสามารถประมวลผลข้อมูลในอดีตปริมาณมาก ระบุรูปแบบ และคาดการณ์ความสัมพันธ์ใหม่ระหว่างข้อมูลที่ไม่รู้จักก่อนหน้านี้ คุณสามารถจำแนกและคาดการณ์เอกสาร รูปภาพ ตัวเลข และประเภทข้อมูลอื่นๆ ได้ 

ตัวอย่างเช่น องค์กรทางการเงินสามารถฝึกระบบแมชชีนเลิร์นนิงเพื่อจำแนกธุรกรรมที่เป็นการฉ้อโกงและเป็นของแท้ได้ ระบบจะระบุรูปแบบในข้อมูลที่ทราบเพื่อคาดเดาหรือคาดการณ์ได้อย่างแม่นยำว่าธุรกรรมใหม่เป็นของแท้หรือไม่

การเรียนรู้ของเครื่องในคำง่ายๆ คืออะไร

ML ย่อมาจาก Machine Learning ซึ่งเป็นสาขาหนึ่งของปัญญาประดิษฐ์ (AI) และวิทยาศาสตร์คอมพิวเตอร์ที่ใช้ประโยชน์จากข้อมูลและอัลกอริทึมเพื่อให้ระบบ AI สามารถเรียนรู้และปรับปรุงในลักษณะที่คล้ายกับมนุษย์ โดยค่อยๆ เพิ่มความแม่นยำเมื่อเวลาผ่านไป

อะไรคือความแตกต่างระหว่างแมชชีนเลิร์นนิงกับปัญญาประดิษฐ์

แม้ว่าคำว่าแมชชีนเลิร์นนิงและปัญญาประดิษฐ์ (AI) อาจใช้สลับกันได้ แต่ทั้งสองคำนี้ไม่เหมือนกัน แมชชีนเลิร์นนิงเป็นหนึ่งในหลาย ๆ สาขาของ AI แม้ว่าแมชชีนเลิร์นนิงก็คือ AI แต่จะบางกิจกรรมของ AI ก็ไม่ถือว่าเป็นแมชชีนเลิร์นนิง

โดยปัญญาประดิษฐ์เป็นคำศัพท์ที่มีความหมายครอบคลุมสำหรับกลยุทธ์และเทคนิคต่าง ๆ ที่ใช้เพื่อทำให้เครื่องจักรมีลักษณะเหมือนมนุษย์มากขึ้น ซึ่ง AI รวมถึงทุกสิ่งตั้งแต่ผู้ช่วยอัจฉริยะอย่าง Alexa, แชทบอท เครื่องมือสร้างรูปภาพ ไปจนถึงหุ่นยนต์ดูดฝุ่นและรถยนต์ที่ขับเคลื่อนด้วยตัวเอง 

ในทางตรงกันข้าม โมเดลแมชชีนเลิร์นนิงจะดำเนินการวิเคราะห์ข้อมูลที่เฉพาะเจาะจงมากขึ้น เช่น การจำแนกเอกสาร การระบุประเภทรูปภาพ หรือการคาดการณ์กำหนดการบำรุงรักษาอุปกรณ์ในโรงงาน เทคโนโลยีแมชชีนเลิร์นนิงนั้นมีพื้นฐานมาจากคณิตศาสตร์และสถิติเป็นหลัก ในขณะที่ AI ประเภทอื่นๆ มีความซับซ้อนมากกว่า

เรียนรู้เพิ่มเติมเกี่ยวกับแมชชีนเลิร์นนิงกับปัญญาประดิษฐ์

ความแตกต่างระหว่างแมชชีนเลิร์นนิงกับดีปเลิร์นนิงคืออะไร

ดีปเลิร์นนิงเป็นรูปแบบเฉพาะของแมชชีนเลิร์นนิงที่ใช้นิวรัลเน็ตเวิร์กเพื่อเลียนแบบสมองของมนุษย์ เป็นเทคนิคขั้นสูงในการจัดการงานที่ซับซ้อน เช่น การรู้จำรูปภาพและคำพูด ดีปเลิร์นนิงคือรากฐานสำหรับความก้าวหน้าใน https://aws.amazon.com/what-is/generative-ai/ปัญญาประดิษฐ์ช่วยสร้าง

แมชชีนเลิร์นนิงทำงานอย่างไร

แนวคิดหลักที่อยู่เบื้องหลังแมชชีนเลิร์นนิงคือความสัมพันธ์ทางคณิตศาสตร์ที่มีอยู่ระหว่างการผสมผสานของข้อมูลที่ป้อนเข้าและผลลัพธ์ โมเดลแมชชีนเลิร์นนิงไม่ทราบความสัมพันธ์นี้ล่วงหน้า แต่สามารถเดาได้หากมีตัวอย่างชุดข้อมูลอินพุต-เอาต์พุตมากเพียงพอ ซึ่งหมายความว่าทุกอัลกอริทึมแมชชีนเลิร์นนิงสร้างขึ้นจากฟังก์ชันทางคณิตศาสตร์ที่ปรับเปลี่ยนได้ โดยสามารถทำความเข้าใจหลักการพื้นฐานได้ดังนี้

  1. เรา 'ฝึกฝน' อัลกอริทึมโดยระบุชุดข้อมูลที่ป้อนเข้า/ผลลัพธ์ (i,o) ต่อไปนี้ ได้แก่ (2,10), (5,19) และ (9,31)
  2. โดยอัลกอริทึมจะคำนวณความสัมพันธ์ระหว่างข้อมูลที่ป้อนเข้าและผลลัพธ์โดยมีลักษณะดังนี้ o=3*i+4
  3. จากนั้นเราจะระบุข้อมูลที่ป้อนเข้า 7 และขอให้อัลกอริทึมคาดการณ์ผลลัพธ์ ซึ่งจะสามารถกำหนดผลลัพธ์ได้โดยอัตโนมัติเป็น 25

แม้ว่าเรื่องนี้จะเป็นความเข้าใจพื้นฐาน แต่แมชชีนเลิร์นนิงจะมุ่งเน้นไปที่หลักการที่ว่าระบบคอมพิวเตอร์สามารถเชื่อมโยงทางคณิตศาสตร์กับจุดข้อมูลที่ซับซ้อนทั้งหมด ตราบใดที่มีข้อมูลและความสามารถในการคำนวณด้วยคอมพิวเตอร์ที่เพียงพอในการประมวลผล ดังนั้นความแม่นยำของผลลัพธ์จึงมีความสัมพันธ์กันโดยตรงกับขนาดของข้อมูลที่ป้อนเข้า ระยะต่าง ๆ ของแมชชีนเลิร์นนิงมีดังนี้

การประมวลผลข้อมูล

ข้อมูลดิบจะได้รับการตัดทอนและแปลงเพื่อนำไปใช้ในการฝึกโมเดลแมชชีนเลิร์นนิง ขั้นตอนนี้จะเกี่ยวข้องกับงานต่าง ๆ เช่น การรับมือเมื่อมีค่าที่ตกหล่น การปรับข้อมูลให้มีขนาดตามมาตรฐานทั่วไป หรือการเข้ารหัสข้อมูลข้อความให้อยู่ในรูปแบบตัวเลข โดยระบบอาจเพิ่มข้อมูลอาจหรือจัดการเพื่อปรับปรุงการจัดการโมเดลในกรณีการใช้งานที่กำหนด การประมวลผลล่วงหน้าจะช่วยให้มั่นใจได้ว่าข้อมูลที่ป้อนเข้าสู่โมเดลดังกล่าวมีความเกี่ยวข้องและมีการกำหนดโครงสร้างที่เหมาะสมแล้ว

การฝึกโมเดล

ข้อมูลที่ประมวลผลล่วงหน้าจะใช้เพื่อฝึกอัลกอริทึมแมชชีนเลิร์นนิง อัลกอริทึมดังกล่าวจะพยายามระบุความสัมพันธ์ทางคณิตศาสตร์ระหว่างอินพุตกับผลลัพธ์ที่คาดหวังจากข้อมูลสำหรับการฝึกซ้ำ ๆ จากนั้น โมเดลจะเรียนรู้รูปแบบและความสัมพันธ์ภายในข้อมูล แล้วรวมความรู้นี้ไว้ในพารามิเตอร์ โมเดลจะปรับพารามิเตอร์เพื่อลดความแตกต่างระหว่างการคาดการณ์กับผลลัพธ์ที่แท้จริงที่ทราบมาจากข้อมูลสำหรับการฝึก

การประเมินโมเดล

เป้าหมายคือเพื่อทำให้แน่ใจว่าโมเดลดังกล่าวจะสามารถวิเคราะห์ข้อมูลที่อยู่นอกเหนือจากชุดข้อมูลสำหรับการฝึกได้เป็นอย่างดี ระบบจะนำชุดข้อมูลแยกต่างหากที่เรียกว่าชุดการตรวจสอบมาใช้เพื่อดำเนินการตามจุดประสงค์นี้ และจะวัดผลลัพธ์ของโมเดลโดยใช้เกณฑ์ชี้วัดเกณฑ์มาตรฐานที่แตกต่างกัน ตัวอย่างเช่น ลองนึกดูว่าโมเดลที่ผ่านการฝึกให้ระบุรูปภาพของผลไม้ เช่น แอปเปิ้ลและกล้วยที่เก็บไว้ในตะกร้า การประเมินผลจะตรวจสอบว่าโมเดลดังกล่าวสามารถระบุผลไม้ชนิดเดียวกันได้อย่างถูกต้องหรือไม่ จากภาพที่แสดงผลไม้วางไว้บนโต๊ะหรือในมือของคนบางคน

การเพิ่มประสิทธิภาพ

การเพิ่มประสิทธิภาพจะเกี่ยวข้องกับการปรับแต่งโมเดลเพื่อปรับปรุงประสิทธิภาพของโมเดลนั้น ๆ นักวิทยาศาสตร์ข้อมูลสามารถกำหนดค่ากระบวนการเรียนรู้ใหม่หรือดำเนินกระบวนการสร้างฟีเจอร์ใหม่ได้ ซึ่งจะสร้างฟีเจอร์อินพุตใหม่จากข้อมูลที่มีอยู่ ทั้งนี้ขึ้นอยู่กับประเภทของโมเดลนั้นๆ เป้าหมายคือการเพิ่มความแม่นยำ ประสิทธิภาพ และความสามารถในการวิเคราะห์ข้อมูลใหม่ ๆ ได้เป็นอย่างดี

ประโยชน์ของการเรียนรู้ของเครื่องมีอะไรบ้าง

ข้อมูลเป็นแรงผลักดันที่สำคัญเบื้องหลังการตัดสินใจทางธุรกิจ องค์กรสมัยใหม่จะจัดทำข้อมูลขึ้นจากแหล่งที่มานับพันแห่ง รวมถึง เซ็นเซอร์อัจฉริยะ พอร์ทัลลูกค้า โซเชียลมีเดีย และข้อมูลบันทึกจากแอปพลิเคชัน แมชชีนเลิร์นนิงทำให้กระบวนการเก็บรวบรวมข้อมูล การจำแนก และการวิเคราะห์ดำเนินการได้โดยอัตโนมัติและมีประสิทธิภาพมากขึ้น ธุรกิจสามารถกระตุ้นการเติบโต ปลดล็อกช่องทางรายได้ใหม่ ๆ และแก้ปัญหาที่ท้าทายได้เร็วขึ้น

ประโยชน์ของแมชชีนเลิร์นนิง มีดังนี้

การตัดสินใจจากข้อมูล

ระบบแมชชีนเลิร์นนิงสามารถประมวลผลและวิเคราะห์ปริมาณข้อมูลจำนวนมากได้อย่างรวดเร็วและแม่นยำ ระบบเหล่านี้สามารถระบุรูปแบบที่ไม่คาดคิดในข้อมูลที่ซับซ้อนและเปลี่ยนแปลงอยู่ตลอดได้แบบเรียลไทม์ องค์กรสามารถตัดสินใจโดยอิงจากข้อมูลได้ในเวลารันไทม์และตอบสนองต่อสภาวะที่เปลี่ยนแปลงได้อย่างมีประสิทธิภาพมากขึ้น ทั้งยังสามารถเพิ่มประสิทธิภาพการดำเนินงานและลดความเสี่ยงได้อย่างมั่นใจ

ระบบอัตโนมัติสำหรับงานประจำวัน

อัลกอริทึมแมชชีนเลิร์นนิงสามารถกรอง จัดเรียง และจำแนกข้อมูลได้โดยไม่ต้องให้มนุษย์เข้ามาช่วยเหลือ โดยสามารถทำได้ทั้งสรุปรายงาน สแกนเอกสาร ถอดเสียง และติดแท็กเนื้อหา ซึ่งเป็นงานที่น่าเบื่อและใช้เวลานานหากมนุษย์เป็นผู้ดำเนินการ การปรับการทำงานประจำวันและงานแบบเดิมซ้ำ ๆ ให้ดำเนินไปได้โดยอัตโนมัติจะนำไปสู่ผลิตภาพที่เพิ่มขึ้นและการลดต้นทุนได้อย่างมาก นอกจากนี้ คุณยังจะได้รับความแม่นยำและประสิทธิภาพที่ดียิ่งขึ้นอีกด้วย

ประสบการณ์ของลูกค้าที่ดียิ่งขึ้น

แมชชีนเลิร์นนิงจะเปลี่ยนประสบการณ์ของลูกค้าด้วยการปรับให้เหมาะกับลูกค้าแต่ละราย ตัวอย่างเช่น ผู้ค้าปลีกแนะนำผลิตภัณฑ์ให้กับลูกค้าโดยอิงจากการซื้อครั้งก่อน ประวัติการเลือกดูบนเว็บ และรูปแบบการค้นหา บริการสตรีมมิ่งปรับแต่งคำแนะนำในการดูในอุตสาหกรรมบันเทิง แนวทางที่เหมาะกับลูกค้าแต่ละรายนี้จะช่วยให้อัตราการรักษาลูกค้าและความภักดีต่อแบรนด์เพิ่มสูงขึ้น

การจัดการทรัพยากรเชิงรุก

องค์กรใช้แมชชีนเลิร์นนิงเพื่อคาดการณ์แนวโน้มและพฤติกรรมด้วยความแม่นยำสูง ตัวอย่างเช่น การวิเคราะห์เชิงคาดการณ์สามารถคาดการณ์ความต้องการในด้านสินค้าคงคลังและเพิ่มประสิทธิภาพระดับการสต็อกเพื่อลดค่าโสหุ้ยได้ ข้อมูลเชิงลึกเชิงคาดการณ์มีความสำคัญมากต่อการวางแผนและการจัดสรรทรัพยากร ทั้งยังทำให้องค์กรสามารถดำเนินการเชิงรุกได้มากขึ้น แทนที่จะรอรับมือเพียงอย่างเดียว

การปรับปรุงอย่างต่อเนื่อง

ข้อดีที่โดดเด่นของแมชชีนเลิร์นนิงคือความสามารถที่ยิ่งประมวลผลข้อมูลมากเท่าไร ก็จะดีขึ้นมากเท่านั้น ระบบแมชชีนเลิร์นนิงจะปรับตัวและเรียนรู้จากข้อมูลใหม่ ๆ โดยจะปรับและเพิ่มประสิทธิภาพการทำงานเพื่อให้ยังคงใช้งานได้จริงและมีความเกี่ยวข้องอยู่ตลอดเวลา

กรณีใช้งานแมชชีนเลิร์นนิงยอดนิยม 7 กรณี

เราลองมาดูการประยุกต์ใช้แมชชีนเลิร์นนิงในอุตสาหกรรมสำคัญ ๆ บางส่วนกัน ได้แก่

การผลิต

แมชชีนเลิร์นนิงสามารถสนับสนุนการบำรุงรักษาเชิงคาดการณ์ การควบคุมคุณภาพ และการวิจัยเชิงนวัตกรรมในภาคการผลิตได้ นอกจากนี้ยังช่วยให้บริษัทต่างๆ ปรับปรุงโซลูชันด้านโลจิสติกส์ ซึ่งรวมถึงสินทรัพย์ ซัพพลายเชน และการจัดการสินค้าคงคลังได้อีกด้วย ตัวอย่างเช่น ยักษ์ใหญ่ด้านการผลิต 3M ใช้แมชชีนเลิร์นนิงที่จะสร้างสรรค์นวัตกรรมกระดาษทราย อัลกอริทึมแมชชีนเลิร์นนิงยังช่วยให้นักวิจัยของ 3M สามารถวิเคราะห์ว่าการเปลี่ยนแปลงเพียงเล็กน้อยในรูปร่าง ขนาด และทิศทางช่วยปรับปรุงการขัดถูและความทนทานได้อย่างไร โดยข้อเสนอแนะเหล่านั้นจะแจ้งให้กระบวนการผลิตทราบต่อไป

การดูแลสุขภาพและวิทยาศาสตร์ชีวภาพ

การเพิ่มขึ้นอย่างรวดเร็วของเซ็นเซอร์และอุปกรณ์ที่สวมใส่ได้ทำให้เกิดข้อมูลด้านสุขภาพจำนวนมาก โดยโปรแกรมแมชชีนเลิร์นนิงจะวิเคราะห์ข้อมูลนี้ และสนับสนุนแพทย์ในการวินิจฉัยและรักษาได้แบบเรียลไทม์ ในขณะที่นักวิจัยด้านแมชชีนเลิร์นนิงกำลังพัฒนาโซลูชันที่ตรวจหาเนื้องอกที่เป็นมะเร็งและวินิจฉัยโรคตา ซึ่งส่งผลกระทบอย่างมีนัยสำคัญต่อสุขภาพของมนุษย์ ตัวอย่างเช่น Cambia Health Solutions ใช้แมชชีนเลิร์นนิงเพื่อปรับแต่งการรักษาสำหรับหญิงตั้งครรภ์และทำให้กระบวนการดังกล่าวเป็นไปโดยอัตโนมัติ

บริการทางการเงิน

โครงการด้านแมชชีนเลิร์นนิงทางการเงินช่วยปรับปรุงการวิเคราะห์ความเสี่ยงและระเบียบข้อบังคับ เทคโนโลยีแมชชีนเลิร์นนิงช่วยให้นักลงทุนสามารถระบุโอกาสใหม่ ๆ โดยการวิเคราะห์การเคลื่อนไหวของตลาดหุ้น การประเมินกองทุนบริหารความเสี่ยง หรือการจัดระเบียบกลุ่มหลักทรัพย์ทางการเงิน นอกจากนี้ยังสามารถช่วยคุณระบุลูกค้าสินเชื่อที่มีความเสี่ยงสูงและหลีกเลี่ยงโอกาสที่จะเกิดการฉ้อโกงได้อีกด้วย ตัวอย่างเช่น NerdWallet ซึ่งเป็นบริษัทด้านการเงินส่วนบุคคล ใช้แมชชีนเลิร์นนิงเพื่อเปรียบเทียบผลิตภัณฑ์ทางการเงิน เช่น บัตรเครดิต การธนาคาร และสินเชื่อ

การค้าปลีก

แวดวงการค้าปลีกสามารถใช้แมชชีนเลิร์นนิงเพื่อปรับปรุงการบริการลูกค้า การจัดการสต็อก การเพิ่มยอดขาย และการตลาดแบบข้ามช่องทาง ตัวอย่างเช่น Amazon Fulfillment (AFT) ลดต้นทุนโครงสร้างพื้นฐานลง 40 เปอร์เซ็นต์โดยใช้โมเดลแมชชีนเลิร์นนิงเพื่อระบุสินค้าคงคลังที่วางผิดที่ ซึ่งช่วยให้ทำได้ตามคำมั่นสัญญาของ Amazon ที่ว่าสินค้าจะพร้อมให้ลูกค้าใช้งานได้และมาถึงตรงเวลา แม้จะต้องดำเนินการจัดส่งสินค้าทั่วโลกหลายล้านรายการต่อปีก็ตาม

สื่อและความบันเทิง

บริษัทด้านความบันเทิงหันไปใช้แมชชีนเลิร์นนิงเพื่อทำความเข้าใจกลุ่มเป้าหมายของตนให้ดีขึ้น และนำเสนอเนื้อหาที่น่าดึงดูด เป็นส่วนตัว และตามความต้องการได้ โดยมีการปรับใช้อัลกอริทึมแมชชีนเลิร์นนิงเพื่อช่วยในการออกแบบตัวอย่างและโฆษณาอื่นๆ ให้คำแนะนำเนื้อหาที่เป็นส่วนตัวแก่ผู้บริโภค หรือแม้แต่ปรับปรุงการผลิตให้มีประสิทธิภาพ 

ตัวอย่างเช่น Disney ใช้แมชชีนเลิร์นนิงเพื่อเก็บถาวรไลบรารีสื่อ โดยเครื่องมือแมชชีนเลิร์นนิงจะติดแท็ก บรรยาย และจัดเรียงเนื้อหาสื่อโดยอัตโนมัติ ทำให้นักเขียนและนักสร้างแอนิเมชั่นของ Disney สามารถทำความคุ้นเคยและค้นหาตัวละครของ Disney ได้อย่างรวดเร็ว

คอมพิวเตอร์วิทัศน์

คอมพิวเตอร์วิทัศน์เป็นเทคโนโลยีที่จะจดจำและอธิบายภาพโดยอัตโนมัติอย่างแม่นยำและมีประสิทธิภาพ ปัจจุบัน ระบบคอมพิวเตอร์สามารถเข้าถึงภาพและวิดีโอจำนวนมากจากสมาร์ทโฟน กล้องจราจร ระบบรักษาความปลอดภัย และอุปกรณ์อื่น ๆ ได้แล้ว แอปพลิเคชันคอมพิวเตอร์วิชันจะใช้แมชชีนเลิร์นนิงเพื่อประมวลผลข้อมูลนี้อย่างแม่นยำสำหรับการระบุวัตถุและการจดจำใบหน้า ตลอดจนการจำแนกประเภท การให้คำแนะนำ การตรวจสอบ และการตรวจจับ

ตัวอย่างเช่น Campsite เป็นแพลตฟอร์มซอฟต์แวร์ชั้นนำสำหรับค่ายฤดูร้อน ค่ายต่าง ๆ ที่ใช้งานแพลตฟอร์มนี้จะอัปโหลดภาพหลายพันภาพทุกวันเพื่อให้ผู้ปกครองได้ทราบถึงประสบการณ์การเข้าค่ายของบุตรหลานตน การค้นหาภาพถ่ายของบุตรหลานของตนที่ไปเข้าค่ายจึงใช้เวลานานและเป็นเรื่องน่าหงุดหงิดสำหรับผู้ปกครอง CampSite จึงใช้แมชชีนเลิร์นนิงเพื่อระบุภาพโดยอัตโนมัติและแจ้งให้ผู้ปกครองทราบเมื่อมีการอัปโหลดรูปภาพใหม่ของบุตรหลานของพวกเขา

อัลกอริทึมของแมชชีนเลิร์นนิงมีกี่ประเภท

อัลกอริทึมแมชชีนเลิร์นนิงสามารถแบ่งออกได้ตามรูปแบบการเรียนรู้ที่แตกต่างกันสี่ประเภท โดยขึ้นอยู่กับผลลัพธ์ที่คาดหวังและประเภทของข้อมูลที่ป้อนเข้า

แมชชีนเลิร์นนิงแบบมีผู้สอน

นักวิทยาศาสตร์ข้อมูลจัดหาอัลกอริทึมที่มีข้อมูลการฝึกฝนที่มีการระบุประเภทและกำหนดไว้เพื่อประเมินความสัมพันธ์กัน โดยข้อมูลตัวอย่างจะระบุทั้งข้อมูลที่ป้อนเข้าและผลลัพธ์ของอัลกอริทึม การระบุประเภทข้อมูล คือการจัดหมวดหมู่ข้อมูลอินพุตด้วยค่าเอาต์พุตที่กำหนดที่สอดคล้องกัน ตัวอย่างเช่น จะต้องมีการติดแท็กรูปภาพของแอปเปิ้ลและกล้วยหลายล้านรายการด้วยคำว่า “แอปเปิ้ล” หรือ “กล้วย” จากนั้นแอปพลิเคชันแมชชีนเลิร์นนิงก็จะสามารถใช้ข้อมูลการฝึกนี้เพื่อเดาชื่อของผลไม้ได้เมื่อให้บอกชื่อผลไม้จากในภาพ

โดยจุดแข็งของแมชชีนเลิร์นนิงแบบมีผู้สอนคือความเรียบง่ายและความสะดวกในการออกแบบ ซึ่งมีประโยชน์เมื่อต้องคาดการณ์ชุดผลลัพธ์ที่เป็นไปได้แบบจำกัด โดยแบ่งข้อมูลออกเป็นหมวดหมู่ หรือรวมผลลัพธ์จากอัลกอริทึมแมชชีนเลิร์นนิงอีกสองแบบเข้าด้วยกัน อย่างไรก็ตาม การระบุประเภทชุดข้อมูลที่ไม่มีการระบุประเภทหลายล้านรายการก็อาจถือเป็นเรื่องที่ท้าทาย

แมชชีนเลิร์นนิงแบบไม่มีผู้สอน

อัลกอริทึมแมชชีนเลิร์นนิงแบบไม่มีผู้สอนจะฝึกกับข้อมูลที่ไม่มีการระบุประเภท ซึ่งจะสแกนผ่านข้อมูลใหม่ โดยพยายามสร้างการเชื่อมต่อที่มีความหมายระหว่างข้อมูลที่ป้อนเข้าและผลลัพธ์ที่กำหนดไว้ล่วงหน้า โดยอัลกอริทึมดังกล่าวสามารถระบุรูปแบบและจัดหมวดหมู่ข้อมูลได้ ตัวอย่างเช่น อัลกอริทึมแบบไม่มีผู้สอนสามารถจัดกลุ่มบทความข่าวจากเว็บไซต์ข่าวต่างๆ ออกเป็นหมวดหมู่ทั่วไปต่างๆ เช่น กีฬา อาชญากรรม ฯลฯ ซึ่งสามารถใช้การประมวลผลภาษาธรรมชาติเพื่อทำความเข้าใจความหมายและอารมณ์ในบทความดังกล่าวได้ ในธุรกิจค้าปลีก การเรียนรู้แบบไม่มีผู้ดูแลอาจพบรูปแบบการซื้อของลูกค้าและให้ผลการวิเคราะห์ข้อมูล ตัวอย่างเช่นล ูกค้ามีแนวโน้มที่จะซื้อขนมปังมากที่สุด หากลูกค้ารายนั้น ๆ ซื้อเนยด้วย

แมชชีนเลิร์นนิงแบบไม่มีผู้ดูแลมีประโยชน์อย่างยิ่งสำหรับการจดจำรูปแบบ การตรวจจับความผิดปกติ และการจัดกลุ่มข้อมูลเป็นหมวดหมู่โดยอัตโนมัติ เนื่องจากข้อมูลการฝึกไม่ต้องอาศัยการระบุประเภท จึงตั้งค่าได้ง่าย นอกจากนี้ อัลกอริทึมเหล่านี้ยังสามารถใช้เพื่อล้างและประมวลผลข้อมูลสำหรับการสร้างโมเดลอัตโนมัติได้อีกด้วย ข้อจำกัดของวิธีนี้คือไม่สามารถคาดการณ์ได้อย่างแม่นยำและไม่สามารถแยกผลลัพธ์ข้อมูลเฉพาะที่ต้องการได้อย่างอิสระ

แมชชีนเลิร์นนิงแบบกึ่งมีผู้สอน

ตามที่ชื่อระบุไว้ วิธีการนี้จะผสมผสานแมชชีนเลิร์นนิงแบบมีผู้สอนและแมชชีนเลิร์นนิงแบบไม่มีผู้สอนเข้าด้วยกัน โดยเทคนิคนี้อาศัยการใช้ข้อมูลที่มีการระบุประเภทจำนวนเล็กน้อยและข้อมูลที่ไม่มีการระบุประเภทจำนวนมากในการฝึกระบบ ขั้นแรก เราจะใช้ข้อมูลที่มีการระบุประเภทในการฝึกบางส่วนของอัลกอริทึมแมชชีนเลิร์นนิง หลังจากนั้น อัลกอริทึมที่ได้รับการฝึกเพียงบางส่วนจะระบุประเภทข้อมูลที่ไม่มีการระบุประเภท โดยกระบวนการนี้เรียกว่าการระบุประเภทเทียม จากนั้นโมเดลดังกล่าวจะได้รับการฝึกใหม่เกี่ยวกับการผสมผสานข้อมูลที่เป็นผลลัพธ์โดยไม่ได้เขียนโปรแกรมไว้อย่างชัดเจน

ข้อดีของวิธีนี้คือไม่ต้องใช้ข้อมูลที่มีการระบุประเภทจำนวนมาก ซึ่งเหมาะเป็นอย่างยิ่งเมื่อต้องทำงานร่วมกับข้อมูลบางประเภท เช่น เอกสารขนาดยาว ซึ่งอาจใช้เวลานานเกินกว่าที่มนุษย์จะอ่านและระบุประเภทได้

การเรียนรู้แบบเสริมกำลัง

การเรียนรู้เสริมแรง เป็นวิธีการที่มีค่ารางวัลแนบกับขั้นตอนต่างๆ ที่อัลกอริทึมต้องผ่าน ดังนั้นเป้าหมายของโมเดลดังกล่าวคือการสะสมคะแนนให้ได้มากที่สุดและบรรลุเป้าหมายสุดท้ายได้ในที่สุด โดยการประยุกต์ใช้การเรียนรู้แบบเสริมกำลังในทางปฏิบัติส่วนใหญ่ในทศวรรษที่ผ่านมาอยู่ในวิดีโอเกม อัลกอริทึมการเรียนรู้แบบเสริมกำลังที่ล้ำสมัยได้บรรลุผลลัพธ์ที่น่าประทับใจทั้งในเกมสุดคลาสสิกและเกมสมัยใหม่ ซึ่งมักจะเอาชนะคู่ต่อสู้ที่เป็นมนุษย์ได้เป็นส่วนใหญ่ 

ความท้าทายที่การเรียนรู้แบบเสริมกำลังต้องเผชิญก็คือสภาพแวดล้อมในโลกแห่งความเป็นจริงเปลี่ยนแปลงอย่างมากบ่อยครั้ง และมีการเตือนอย่างจำกัด อาจทำให้การนำอัลกอริธึมนำไปใช้งานจริงอย่างประสิทธิภาพได้ยากขึ้น ความเอนเอียงของนักพัฒนาอาจส่งผลต่อผลลัพธ์ได้ เพราะในขณะที่นักวิทยาศาสตร์ข้อมูลออกแบบรางวัลต่าง ๆ สิ่งเหล่านี้ก็อาจมีอิทธิพลต่อผลลัพธ์ได้เช่นกัน

ดีปเลิร์นนิ่ง

เรียนรู้เชิงลึก เป็นเทคนิคการเรียนรู้ของเครื่องชนิดหนึ่งที่สร้างแบบจำลองในสมองมนุษย์ โดยอัลกอริทึมดีปเลิร์นนิงจะวิเคราะห์ข้อมูลด้วยโครงสร้างตรรกะที่คล้ายคลึงกับที่มนุษย์ใช้ อัลกอริทึมเหล่านี้จะใช้นิวรัลเน็ตเวิร์กเพื่อประมวลผลข้อมูลเป็นเลเยอร์ ๆ นิวรัลเน็ตเวิร์กเทียม (ANN) จะสร้างขึ้นจากโหนดซอฟต์แวร์ที่เรียกว่านิวรอนเทียมซึ่งมีหน้าที่ประมวลผลข้อมูลโดยรวม โดยข้อมูลจะไหลจากชั้นนิวรอนที่ป้อนเข้าผ่านชั้นนิวรัลเน็ตเวิร์กเทียมที่ซ่อนอยู่ “ลึก” หลายชั้นก่อนที่จะมาถึงชั้นผลลัพธ์ ซึ่งชั้นที่ซ่อนอยู่เพิ่มเติมสนับสนุนการเรียนรู้ที่มีความสามารถมากกว่าในโมเดลแมชชีนเลิร์นนิงมาตรฐาน

อ่านเกี่ยวกับนิวรัลเน็ตเวิร์ก »

เรียนรู้เพิ่มเติมเกี่ยวกับดีปเลิร์นนิงและแมชชีนเลิร์นนิง

รูปแบบแมชชีนเลิร์นนิงเป็นแบบเชิงกำหนดหรือไม่

หากผลลัพธ์ของระบบสามารถคาดเดาได้ ก็แสดงว่ารูปแบบดังกล่าวเป็นแบบเชิงกำหนด โดยการประยุกต์ใช้ซอฟต์แวร์ส่วนใหญ่จะตอบสนองต่อการกระทำของผู้ใช้งานที่คาดคะเนได้ ดังนั้นคุณสามารถพูดได้ว่า “หากผู้ใช้ทำเช่นนี้ เขาจะได้รับสิ่งนั้น” อย่างไรก็ตาม อัลกอริทึมแมชชีนเลิร์นนิงจะเรียนรู้ผ่านการสังเกตการณ์ร่วมกับประสบการณ์ ดังนั้นจึงมีลักษณะเชิงความเป็นไปได้ทางสถิติโดยธรรมชาติ ตอนนี้ข้อความดังกล่าวก็จะเปลี่ยนเป็น “หากผู้ใช้ทำเช่นนี้ ก็มีโอกาส X% ที่สิ่งนั้นจะเกิดขึ้น”

ในฝั่งแมชชีนเลิร์นนิง การกำหนดถือเป็นกลยุทธ์ที่ใช้ในขณะที่ประยุกต์ใช้วิธีการเรียนรู้ที่อธิบายไว้ข้างต้น ทั้งนี้วิธีการฝึกฝนแบบมีผู้สอน แบบไม่มีผู้สอน และแบบอื่นๆ สามารถเป็นแบบเชิงกำหนดได้ โดยขึ้นอยู่กับผลลัพธ์ที่ต้องการของธุรกิจ โดยคำถามในการวิจัย การเรียกข้อมูล โครงสร้าง และการตัดสินใจด้านการจัดเก็บข้อมูลจะเป็นตัวกำหนดว่าจะนำกลยุทธ์ที่เป็นแบบเชิงกำหนดหรือไม่ได้เป็นแบบเชิงกำหนดมาใช้

แนวทางแบบเชิงกำหนดเทียบกับความเป็นไปได้ทางสถิติ

แนวทางแบบเชิงกำหนดจะมุ่งเน้นไปที่ความถูกต้องและปริมาณข้อมูลที่รวบรวม ดังนั้นประสิทธิภาพจึงมีความสำคัญมากกว่าความไม่แน่นอน ในทางกลับกัน กระบวนการที่ไม่ได้เป็นแบบเชิงกำหนด (หรือแบบความเป็นไปได้ทางสถิติ) ได้รับการออกแบบมาเพื่อจัดการปัจจัยทางโอกาส โดยมีการบูรณาการเครื่องมือในตัวร่วมกับอัลกอริทึมแมชชีนเลิร์นนิงเพื่อช่วยในการแสดงปริมาณ ระบุ และวัดความไม่แน่นอนในระหว่างการเรียนรู้และการสังเกตการณ์

คุณจะนำแมชชีนเลิร์นนิงไปปรับใช้ในองค์กรของคุณได้อย่างไร

การเริ่มต้นใช้งานแมชชีนเลิร์นนิงต้องมีการนำวงจรการใช้งานของแมชชีนเลิร์นนิงไปปรับใช้ ซึ่งประกอบด้วยวลีดังต่อไปนี้

เป้าหมายทางธุรกิจ

องค์กรที่พิจารณาใช้แมชชีนเลิร์นนิงควรเริ่มจากระบุปัญหาที่ต้องการแก้ไขก่อนเป็นอันดับแรก ระบุคุณค่าทางธุรกิจที่คุณได้รับจากการใช้แมชชีนเลิร์นนิงในการแก้ปัญหา คุณสามารถวัดมูลค่าทางธุรกิจโดยใช้เกณฑ์ความสำเร็จสำหรับวัตถุประสงค์ทางธุรกิจได้หรือไม่ วิธีการที่มุ่งเน้นเป้าหมายช่วยให้คุณพิสูจน์ค่าใช้จ่ายและโน้มน้าวใจผู้มีส่วนเกี่ยวข้องที่สำคัญ

การกำหนดกรอบปัญหา

ลำดับถัดไป ให้กำหนดกรอบปัญหาทางธุรกิจเป็นปัญหาสำหรับแมชชีนเลิร์นนิง ระบุสิ่งที่จะคอยสังเกตและสิ่งที่ควรคาดการณ์ ขั้นตอนสำคัญในระยะนี้คือการกำหนดว่าจะคาดการณ์ในเรื่องใดบ้าง และวิธีเพิ่มประสิทธิภาพและเกณฑ์ชี้วัดข้อผิดพลาดที่เกี่ยวข้อง

การประมวลผลข้อมูล

การประมวลผลข้อมูลจะแปลงข้อมูลให้เป็นรูปแบบที่ใช้งานได้โดยใช้อัลกอริทึมของแมชชีนเลิร์นนิง โดยการประมวลผลดังกล่าวจะรวมถึงการระบุ การเก็บรวบรวม และการประมวลผลข้อมูลล่วงหน้าพร้อมกับกระบวนการสร้างฟีเจอร์ใหม่ คุณสร้าง แปลง แยก และเลือกตัวแปรแมชชีนเลิร์นนิงจากข้อมูลของคุณ

การพัฒนาโมเดลและการนำไปใช้จริง

การดำเนินการนี้คือกระบวนการหลักของการฝึก ปรับจูน และประเมินโมเดลของคุณตามที่อธิบายไว้ในส่วนก่อนหน้า รวมถึงการสร้าง MLOps การดำเนินงานแมชชีนเลิร์นนิง (MLOps) เป็นชุดของแนวทางปฏิบัติที่ทำให้เวิร์กโฟลว์และการนำแมชชีนเลิร์นนิง (ML) ไปใช้งานจริง เป็นไปโดยอัตโนมัติและลดความยุ่งยากลง โดยจะเป็นการรวมการพัฒนา ML เข้ากับการใช้งานและการนำไปใช้จริง ตัวอย่างเช่น คุณสามารถสร้างไปป์ไลน์ CI/CD ที่ทำให้การสร้าง การฝึก และเปิดให้ใช้งานในสภาพแวดล้อมที่จัดเตรียมไว้และสภาพแวดล้อมการใช้งานจริงเป็นไปโดยอัตโนมัติ

การตรวจสอบ

ระบบการตรวจติดตามช่วยให้มั่นใจได้ว่าโมเดลของคุณจะรักษาระดับประสิทธิภาพที่ต้องการไว้ได้ผ่านการตรวจจับและการลดความเสี่ยงล่วงหน้า อีกทั้งยังรวมถึงการเก็บรวบรวมความคิดเห็นของผู้ใช้เพื่อรักษาและปรับปรุงโมเดล เพื่อให้โมเดลดังกล่าวยังคงมีความเกี่ยวข้องอยู่เสมอแม้เวลาผ่านไป

ความท้าทายในการปรับใช้แมชชีนเลิร์นนิงมีอะไรบ้าง

ความท้าทายในการนำแมชชีนเลิร์นนิงไปปรับใช้มีดังนี้

คุณภาพข้อมูล

ประสิทธิภาพของโมเดลแมชชีนเลิร์นนิงขึ้นอยู่กับคุณภาพของข้อมูลที่ใช้ในการฝึก ปัญหาต่าง ๆ เช่น ค่าที่ตกหล่น รายการข้อมูลที่ไม่สอดคล้องกัน และเสียงรบกวนอาจทำให้ความแม่นยำของโมเดลลดลงอย่างมีนัยสำคัญ นอกจากนี้การที่มีชุดข้อมูลขนาดใหญ่ไม่เพียงพอก็อาจทำให้แมชชีนเลิร์นนิงไม่สามารถเรียนรู้ได้อย่างมีประสิทธิภาพ การตรวจสอบให้แน่ใจว่าข้อมูลมีความสมบูรณ์และการขยายขอบเขตการเก็บรวบรวมข้อมูลโดยไม่ลดทอนคุณภาพ เรียกได้ว่าเป็นความท้าทายที่เรายังต้องเผชิญอยู่

โอเวอร์ฟิตติ้งและอันเดอร์ฟิตติ้ง

โอเวอร์ฟิตติ้งจะเกิดขึ้นเมื่อโมเดลแมชชีนเลิร์นนิงเรียนรู้รายละเอียดและเสียงรบกวนในข้อมูลการฝึกจนถึงขั้นที่ส่งผลเสียต่อประสิทธิภาพของโมเดลในการวิเคราะห์ข้อมูลใหม่ๆ โมเดลจะเก็บข้อมูลรูปแบบที่ใช้งานกับชุดข้อมูลอื่น ๆ ได้ไม่ดีนัก ในทางกลับกัน อันเดอร์ฟิตติ้งจะเกิดขึ้นเมื่อโมเดลไม่สามารถเรียนรู้รูปแบบพื้นฐานของข้อมูลได้ ซึ่งส่งผลให้การฝึกและการทดสอบข้อมูลมีประสิทธิภาพที่ไม่ดีนัก การปรับสมดุลระหว่างความซับซ้อนของโมเดลกับความสามารถในการวิเคราะห์ข้อมูลใหม่ ๆ ที่ยังไม่เคยใช้ฝึกถือเป็นความท้าทายครั้งใหญ่

ความเอนเอียง

ข้อมูลอาจไม่สมดุลในแอปพลิเคชันหลาย ๆ รายการในโลกแห่งความเป็นจริง ซึ่งหมายความว่าบางคลาสอาจเกิดขึ้นบ่อยกว่าคลาสอื่น ๆ อย่างมีนัยสำคัญ ความไม่สมดุลนี้สามารถทำให้กระบวนการฝึกเกิดความเอนเอียงได้ ซึ่งส่งผลให้โมเดลทำงานได้ดีเมื่อเจอข้อมูลในคลาสหลัก ๆ ในขณะที่ไม่สามารถคาดการณ์ข้อมูลในคลาสที่รองลงมาได้อย่างแม่นยำ ตัวอย่างเช่น หากข้อมูลย้อนหลังให้ความสำคัญกับคุณลักษณะทางประชากรศาสตร์บางรายการ อัลกอริทึมแมชชีนเลิร์นนิงที่ใช้ในแอปพลิเคชันทรัพยากรมนุษย์ก็อาจให้ความสำคัญกับคุณลักษณะทางของประชากรศาสตร์เหล่านั้นต่อไปเช่นกัน เทคนิคต่าง ๆ เช่น การสุ่มตัวอย่างข้อมูล การใช้เกณฑ์ชี้วัดการประเมินที่แตกต่างกัน หรือการใช้อัลกอริทึมการตรวจจับความผิดปกติจะช่วยบรรเทาปัญหาดังกล่าวได้ในระดับหนึ่ง

ความสามารถในการอธิบายของโมเดล

เนื่องจากโมเดลแมชชีนเลิร์นนิง (โดยเฉพาะโมเดลดีปเลิร์นนิง) มีความซับซ้อนมากขึ้น การตัดสินใจของโมเดลเหล่านี้จึงตีความได้น้อยลง การพัฒนาวิธีทำให้โมเดลสามารถตีความได้มากขึ้นโดยไม่ทำให้ประสิทธิภาพลดลงถือเป็นความท้าทายที่สำคัญ โดยสิ่งที่กล่าวไปจะส่งผลต่อความสามารถในการใช้งาน ความน่าเชื่อถือ และข้อควรพิจารณาทางจริยธรรมของการนำระบบแมชชีนเลิร์นนิงไปปรับใช้

ความสามารถในการปรับขนาด

โมเดลแมชชีนเลิร์นนิง โดยเฉพาะรูปแบบที่ที่ใช้ชุดข้อมูลขนาดใหญ่หรืออัลกอริทึมที่ซับซ้อน (เช่น ดีปเลิร์นนิง) ต้องการทรัพยากรที่มาจากการคำนวณด้วยคอมพิวเตอร์จำนวนมาก การฝึกโมเดลเหล่านี้อาจใช้เวลานานและมีค่าใช้จ่ายมาก การเพิ่มประสิทธิภาพอัลกอริทึมเพื่อลดความต้องการด้านข้อมูลจากการคำนวณด้วยคอมพิวเตอร์จึงเป็นส่วนหนึ่งของความท้าทายในการออกแบบอัลกอริทึม บริการที่ใช้งาน AWS Cloud สามารถรองรับการปรับใช้ที่คุ้มค่าได้ในวงกว้าง

ฝึกแมชชีนเลิร์นนิงสำหรับผู้เริ่มต้น

แมชชีนเลิร์นนิงจำเป็นต้องมีรากฐานที่แข็งแกร่งในด้านคณิตศาสตร์ สถิติ การเขียนโค้ด และเทคโนโลยีข้อมูล ผู้ที่ต้องการก้าวหน้าในด้านแมชชีนเลิร์นนิงควรพิจารณาศึกษาระดับปริญญาโทด้านปัญญาประดิษฐ์หรือวิทยาศาสตร์ข้อมูลให้สำเร็จ โดยทั่วไปแล้ว โปรแกรมเหล่านี้จะเกี่ยวข้องกับหัวข้อต่างๆ เช่น นิวรัลเน็ตเวิร์ก การประมวลผลภาษาธรรมชาติ และข้อมูลเชิงลึกเกี่ยวกับคอมพิวเตอร์วิชัน

อย่างไรก็ตาม การศึกษาอย่างเป็นทางการไม่ใช่เป็นเพียงแค่หนทางเดียว คุณสามารถใช้หลักสูตรออนไลน์เพื่อเรียนรู้ในแบบของคุณเองและฝึกฝนทักษะเฉพาะด้านได้ การฝึกแมชชีนเลิร์นนิงบน AWS มีการรับรองโดยผู้เชี่ยวชาญของ AWS ในหัวข้อต่างๆ เช่น:

แมชชีนเลิร์นนิงของ AWS สามารถช่วยได้อย่างไร

AWS สร้างแมชชีนเลิร์นนิงที่นักพัฒนา นักวิทยาศาสตร์ข้อมูล และผู้ใช้ทางธุรกิจทุกรายสามารถเข้าถึงได้ บริการ AWS Machine Learning ให้โครงสร้างพื้นฐานที่มีประสิทธิภาพสูง คุ้มค่า และปรับขนาดได้เพื่อตอบสนองความต้องการทางธุรกิจ

  • หากคุณเพิ่งเริ่มต้น เรียนรู้การเรียนรู้ของเครื่องด้วยอุปกรณ์การศึกษาที่ใช้งานได้จริงของเรา เช่น AWS DeepRacer และ AWS DeepComposer
  • หากคุณมีที่เก็บข้อมูลถาวรเดิมอยู่แล้ว ใช้ Amazon SageMaker Ground Truth สำหรับเวิร์กโฟลว์การติดฉลากข้อมูลในตัวที่รองรับวิดีโอ รูปภาพ และข้อความ
  • หากคุณมีระบบแมชชีนเลิร์นนิงเดิมอยู่แล้ว ใช้ Amazon SageMaker Clarityเพื่อตรวจจับอคติและ การฝึกอบรม แบบจำลองของ Amazon SageMaker เพื่อตรวจสอบและเพิ่มประสิทธิภาพการทำงาน
  • หากคุณต้องการนำดีปเลิร์นนิงไปปรับใช้ ใช้ Amazon SageMaker Model Training เพื่อฝึกโมเดลการเรียนรู้เชิงลึกขนาดใหญ่โดยอัตโนมัติ 

เริ่มต้นใช้งาน AI ดีปเลิร์นนิงบน AWS โดย https://signin.aws.amazon.com/signin/สร้างบัญชีฟรีวันนี้!