การเรียนรู้แบบมีผู้ดูแลแตกต่างกับแบบไม่มีผู้ดูแลอย่างไร

อะไรคือความแตกต่างระหว่างแมชชีนเลิร์นนิงแบบมีผู้ดูแลและไม่มีผู้ดูแล

การเรียนรู้ของเครื่อง (ML) ที่มีการกำกับดูแลและไม่มีการดูแล เป็น อัลกอริทึมของ ML สองประเภท อัลกอริทึม ML จะประมวลผลข้อมูลในอดีตปริมาณมากและระบุรูปแบบข้อมูลผ่านการอนุมาน

อัลกอริทึมการเรียนรู้แบบมีผู้ดูแลจะฝึกฝนกับข้อมูลตัวอย่างที่ระบุทั้งอินพุตและเอาต์พุตของอัลกอริทึม ยกตัวอย่างเช่น ข้อมูลอาจจะเป็นรูปภาพของตัวเลขที่เขียนด้วยลายมือพร้อมคำอธิบายประกอบเพื่อบ่งบอกว่าหมายถึงตัวเลขใด เมื่อได้รับข้อมูลที่มีการระบุประเภทอย่างเพียงพอ ระบบการเรียนรู้แบบมีผู้ดูแลจะจดจำคลัสเตอร์ของพิกเซลและรูปร่างที่เชื่อมโยงกับแต่ละหมายเลขที่เขียนด้วยลายมือได้ในท้ายที่สุด

ในทางตรงกันข้าม อัลกอริทึมการเรียนรู้แบบไม่มีผู้ดูแลจะฝึกฝนกับข้อมูลที่ไม่มีการระบุประเภท ซึ่งจะสแกนผ่านข้อมูลใหม่และสร้างการเชื่อมต่อที่มีความหมายระหว่างอินพุตที่ไม่รู้จักกับเอาต์พุตที่กำหนดไว้ล่วงหน้า ยกตัวอย่างเช่น อัลกอริทึมการเรียนรู้แบบไม่มีผู้ดูแลสามารถจัดกลุ่มบทความข่าวจากเว็บไซต์ข่าวต่างๆ ออกเป็นหมวดหมู่ทั่วไปต่างๆ เช่น กีฬาและอาชญากรรม

เทคนิค: การเรียนรู้แบบมีผู้ดูแลเทียบกับการเรียนรู้แบบไม่มีผู้ดูแล

ในการทำแมชชีนเลิร์นนิง คุณจะสอนให้คอมพิวเตอร์ทำการทำนายหรืออนุมาน ขั้นแรก คุณใช้อัลกอริทึมและข้อมูลตัวอย่างในการฝึกโมเดล จากนั้น คุณรวมโมเดลของคุณเข้ากับแอปพลิเคชันของคุณเพื่อสร้างการอนุมานแบบเรียลไทม์และตามขนาด การเรียนรู้แบบมีผู้ดูแลและไม่มีผู้ดูแลเป็นอัลกอริทึมสองประเภทที่แตกต่างกัน

การเรียนรู้แบบมีผู้สอน

ในการเรียนรู้แบบมีผู้ดูแล คุณจะฝึกโมเดลด้วยชุดข้อมูลอินพุตและชุดข้อมูลเอาต์พุตที่มีป้ายกำกับจับคู่ที่สอดคล้องกัน โดยทั่วไปการติดฉลากจะทำด้วยตนเอง ต่อไปคือเทคนิคแมชชีนเลิร์นนิงแบบมีผู้ดูแลบางประเภท

การถดถอยโลจิสติก

รีเกรสชันทางโลจิสติกทำนายผลลัพธ์ที่เป็นหมวดหมู่ตามอินพุตตั้งแต่หนึ่งตัวขึ้นไป การจำแนกประเภทแบบไบนารีคือเมื่อผลลัพธ์ที่จัดอยู่ในประเภทใดประเภทหนึ่งจากสองประเภท เช่น ใช่หรือไม่ใช่ และผ่านหรือไม่ผ่าน การจำแนกประเภทหลายชั้นคือเมื่อผลลัพธ์ที่จัดอยู่ในประเภทมากกว่าสองประเภท เช่น แมว สุนัข หรือกระต่าย ตัวอย่างของรีเกรสชันทางโลจิสติกคือการทำนายว่านักเรียนจะผ่านหรือไม่ผ่านหน่วยการเรียนรู้ตามจำนวนการเข้าสู่ระบบบทเรียน

อ่านเกี่ยวกับการถดถอยโลจิสติกส์”

ถดถอยเชิงเส้น

รีเกรสชันเชิงเส้นหมายถึงโมเดลการเรียนรู้แบบมีผู้ดูแลซึ่งทำนายค่าจากสเกลต่อเนื่องโดยอิงตามอินพุตหนึ่งตัวหรือมากกว่า ตัวอย่างของรีเกรสชันเชิงเส้นคือการทำนายราคาบ้าน คุณสามารถคาดการณ์ราคาบ้านตามสถานที่ตั้ง อายุ และจำนวนห้องได้ หลังจากที่คุณฝึกแบบจำลองในชุดข้อมูลการฝึกอบรมการขายในอดีตด้วยตัวแปรเหล่านั้น

อ่านเกี่ยวกับการถดถอยเชิงเส้น”

ต้นไม้การตัดสินใจ

เทคนิคแมชชีนเลิร์นนิงแบบมีผู้ดูแลของแผนภาพการตัดสินใจต้นไม้ใช้อินพุตที่กำหนดและใช้โครงสร้าง if-else เพื่อทำนายผลลัพธ์ ตัวอย่างของปัญหาแผนภาพการตัดสินใจต้นไม้คือการทำนายการเปลี่ยนใจของลูกค้า ตัวอย่างเช่น หากลูกค้าไม่เยี่ยมชมแอปพลิเคชันหลังจากลงทะเบียน แบบจำลองอาจทำนายการเลิกใช้งาน หรือหากลูกค้าเข้าถึงแอปพลิเคชันบนอุปกรณ์หลายเครื่อง และเวลาเซสชันเฉลี่ยสูงกว่าเกณฑ์ที่กำหนด แบบจำลองอาจคาดการณ์การเก็บรักษา

เครือข่ายประสาท

โซลูชันนิวรัลเน็ตเวิร์กเทียมเป็นเทคนิคการเรียนรู้แบบมีผู้ดูแลที่ซับซ้อนกว่า ในการสร้างผลลัพธ์ที่กำหนด ต้องใช้อินพุตที่กำหนดและทำการแปลงทางคณิตศาสตร์อย่างน้อยหนึ่งชั้นตามการปรับน้ำหนักข้อมูล ตัวอย่างของเทคนิคนิวรัลเน็ตเวิร์กเทียมคือการทำนายตัวเลขจากภาพที่เขียนด้วยลายมือ

อ่านเกี่ยวกับเครือข่ายประสาท”

การเรียนรู้แบบไม่มีผู้ดูแล

แมชชีนเลิร์นนิงแบบไม่มีผู้ดูแลคือเมื่อคุณให้ข้อมูลอินพุตอัลกอริทึมโดยไม่มีข้อมูลเอาต์พุตที่มีป้ายกำกับ จากนั้น อัลกอริทึมจะระบุรูปแบบและความสัมพันธ์ในและระหว่างข้อมูลด้วยตัวมันเอง ต่อไปคือเทคนิคการเรียนรู้แบบไม่มีผู้ดูแลบางประเภท

การคลัสเตอร์

เทคนิคการจัดกลุ่มการเรียนรู้แบบไม่มีผู้ดูแลจะจัดกลุ่มข้อมูลที่ป้อนเข้าไว้ด้วยกัน ดังนั้นข้อมูลเหล่านั้นอาจถูกจัดหมวดหมู่โดยรวม อัลกอริทึมการจัดกลุ่มมีหลายประเภทขึ้นอยู่กับข้อมูลอินพุต ตัวอย่างของการจัดกลุ่มคือการระบุทราฟฟิกเครือข่ายประเภทต่างๆ เพื่อคาดการณ์เหตุการณ์ด้านความปลอดภัยที่อาจเกิดขึ้น

การเรียนรู้กฎสมาคม

เทคนิคการเรียนรู้กฎการเชื่อมโยงเปิดเผยความสัมพันธ์ตามกฎระหว่างอินพุตในชุดข้อมูล ตัวอย่างเช่น อัลกอริธึม Apriori ทำการวิเคราะห์ตะกร้าตลาดเพื่อระบุกฎต่างๆ เช่น กาแฟและนมที่มักซื้อพร้อมกัน

ความหนาแน่นความน่าจะเป็น

เทคนิคความหนาแน่นของความน่าจะเป็นในการเรียนรู้แบบไม่มีผู้ดูแลทำนายโอกาสหรือความเป็นไปได้ที่ค่าของผลลัพธ์จะอยู่ในช่วงของสิ่งที่ถือว่าปกติสำหรับอินพุต ตัวอย่างเช่น มาตรวัดอุณหภูมิในห้องเซิร์ฟเวอร์โดยทั่วไปจะบันทึกระหว่างช่วงองศาที่กำหนด อย่างไรก็ตาม หากจู่ๆ วัดค่าได้ต่ำโดยอิงจากการกระจายความน่าจะเป็น อาจบ่งชี้ว่าอุปกรณ์ทำงานผิดปกติ

การลดมิติ

การลดขนาดเป็นเทคนิคการเรียนรู้แบบไม่มีผู้ดูแลที่ลดจำนวนคุณสมบัติในชุดข้อมูล มักใช้เพื่อประมวลผลข้อมูลล่วงหน้าสำหรับฟังก์ชันแมชชีนเลิร์นนิงอื่นๆ และลดความซับซ้อนและค่าใช้จ่าย ตัวอย่างเช่น, อาจจะเบลอหรือครอบตัดคุณสมบัติแบ็คกราวด์ในแอปพลิเคชันการจดจำภาพ.

ควรใช้เมื่อใด: การเรียนรู้แบบมีผู้ดูแลเทียบกับแบบไม่มีผู้ดูแล

คุณสามารถใช้เทคนิคการเรียนรู้แบบมีผู้ดูแลเพื่อแก้ปัญหาด้วยผลลัพธ์ที่ทราบและมีข้อมูลที่มีป้ายกำกับ ตัวอย่าง ได้แก่ การจัดประเภทสแปมอีเมล การจดจำรูปภาพ และการคาดคะเนราคาหุ้นตามข้อมูลในอดีตที่ทราบ

คุณสามารถใช้การเรียนรู้แบบไม่มีผู้ดูแลสำหรับสถานการณ์ที่ข้อมูลไม่มีป้ายกำกับและมีวัตถุประสงค์เพื่อค้นหารูปแบบ จัดกลุ่มอินสแตนซ์ที่คล้ายกัน หรือตรวจหาความผิดปกติ นอกจากนี้คุณยังสามารถใช้สำหรับงานสำรวจที่ข้อมูลที่มีป้ายกำกับไม่อยู่ ตัวอย่าง ได้แก่ การจัดระเบียบคลังข้อมูลขนาดใหญ่ การสร้างระบบคำแนะนำ และการจัดกลุ่มลูกค้าตามพฤติกรรมการซื้อ

คุณสามารถใช้ทั้งการเรียนรู้แบบมีผู้ดูแลและการเรียนรู้แบบไม่มีผู้ดูแลร่วมกันได้หรือไม่

การเรียนรู้แบบกึ่งมีผู้ดูแลคือการที่คุณใช้ทั้งเทคนิคการเรียนรู้แบบมีผู้ดูแลและแบบไม่มีผู้ดูแลกับปัญหาทั่วไป เป็นอีกหมวดหมู่หนึ่งของแมชชีนเลิร์นนิงในตัวเอง

คุณสามารถใช้การเรียนรู้แบบกึ่งมีผู้ดูแลเมื่อการรับป้ายกำกับสำหรับชุดข้อมูลทำได้ยาก คุณอาจมีข้อมูลที่มีป้ายกำกับจำนวนน้อยกว่าแต่มีข้อมูลที่ไม่มีป้ายกำกับจำนวนมาก เมื่อเทียบกับการใช้ชุดข้อมูลที่มีป้ายกำกับเพียงอย่างเดียว คุณจะมีความแม่นยำและมีประสิทธิภาพมากขึ้นหากคุณรวมเทคนิคการเรียนรู้แบบมีผู้ดูแลและแบบไม่มีผู้ดูแลเข้าด้วยกัน

ต่อไปนี้คือตัวอย่างบางส่วนของแอปพลิเคชันการเรียนรู้แบบกึ่งมีผู้ดูแล

การระบุการฉ้อโกง

ภายในชุดข้อมูลธุรกรรมขนาดใหญ่ มีข้อมูลบางส่วนที่ระบุว่าผู้เชี่ยวชาญได้ยืนยันธุรกรรมที่เป็นการฉ้อโกง เพื่อให้ได้ผลลัพธ์ที่แม่นยำยิ่งขึ้น โซลูชันแมชชีนเลิร์นนิงจะฝึกข้อมูลที่ไม่มีป้ายกำกับก่อน จากนั้นจึงฝึกด้วยข้อมูลที่มีป้ายกำกับ

การวิเคราะห์ความรู้สึก

เมื่อพิจารณาถึงความกว้างของการโต้ตอบกับลูกค้าแบบข้อความขององค์กร การจัดหมวดหมู่หรือป้ายกำกับความคิดเห็นในทุกช่องทางอาจไม่คุ้มทุน องค์กรสามารถฝึกโมเดลในส่วนของข้อมูลที่ไม่มีป้ายกำกับขนาดใหญ่ก่อน แล้วจึงฝึกตัวอย่างที่มีป้ายกำกับ สิ่งนี้จะช่วยให้องค์กรมีความมั่นใจมากขึ้นในความคิดเห็นของลูกค้าทั่วทั้งธุรกิจ

การจัดประเภทเอกสาร

เมื่อใช้หมวดหมู่กับฐานเอกสารขนาดใหญ่ อาจมีเอกสารมากเกินไปที่จะติดฉลาก ตัวอย่างเช่น สิ่งเหล่านี้อาจเป็นรายงาน การถอดเสียง หรือข้อมูลจำเพาะจำนวนนับไม่ถ้วน การฝึกอบรมเกี่ยวกับข้อมูลที่ไม่มีป้ายกำกับเพื่อเริ่มต้นช่วยระบุเอกสารที่คล้ายกันสำหรับการติดฉลาก

สรุปความแตกต่าง: การเรียนรู้แบบมีผู้ดูแลเทียบกับแบบไม่มีผู้ดูแล

	การเรียนรู้ที่มีการดูแล	การเรียนรู้แบบไม่มีผู้ฝึกฝน
คืออะไร	คุณฝึกโมเดลที่มีชุดของข้อมูลอินพุตและชุดที่สอดคล้องกันของข้อมูลการส่งออกที่มีป้ายกำกับจับคู่	คุณฝึกแบบจำลองที่จะค้นพบโมเดลที่ซ่อนอยู่ในข้อมูลที่ไม่มีป้ายกำกับ
เทคนิค	รีเกรสชันทางโลจิสติก รีเกรสชันเชิงเส้น แผนภาพการตัดสินใจต้นไม้ และนิวรัลเน็ตเวิร์ก	การคลัสเตอร์ การเรียนรู้กฎการเชื่อมโยง ความหนาแน่นของความน่าจะเป็น และการลดขนาด
เป้าหมาย	ทำนายผลลัพธ์ตามอินพุตที่รู้จัก	ระบุข้อมูลความสัมพันธ์ที่มีค่าระหว่างจุดข้อมูลอินพุต จากนั้นจะสามารถนำไปใช้กับการป้อนข้อมูลใหจากนั้นสามารถนำไปใช้กับข้อมูลใหม่เพื่อดึงข้อมูลเชิงลึกที่คล้ายกันม่ในการวาดข้อมูลเชิงลึกที่คล้ายกัน
วิธี	ลดข้อผิดพลาดระหว่างเอาต์พุตที่คาดคะเนกับฉลากจริง	ค้นหารูปแบบ ความเหมือน หรือความผิดปกติภายในข้อมูล

AWS สามารถช่วยการเรียนรู้แบบมีผู้ดูแลและแบบไม่มีผู้ดูแลได้อย่างไร

Amazon Web Services (AWS) นำเสนอข้อเสนอที่หลากหลายเพื่อช่วยเหลือคุณด้วยแมชชีนเลิร์นนิง (ML) แบบมีผู้ดูแล แบบไม่มีผู้ดูแลดูแล และแบบกึ่งมีผู้ดูแล คุณสามารถสร้าง เรียกใช้ และผสานโซลูชันทุกขนาด ความซับซ้อน หรือกรณีการใช้งาน

Amazon SageMaker เป็นแพลตฟอร์มที่สมบูรณ์ในการสร้างโซลูชัน ML ของคุณตั้งแต่เริ่มต้น SageMaker มีชุดโมเดลการเรียนรู้ทั้งแบบมีผู้ดูแลและแบบไม่มีผู้ดูแลที่สร้างไว้ล่วงหน้า ความสามารถในการเก็บและการคำนวณ และสภาพแวดล้อมที่มีการจัดการเต็มรูปแบบ

ตัวอย่างเช่น นี่คือคุณสมบัติของ SageMaker ที่คุณสามารถใช้ในงานของคุณ

ใช้ Amazon SageMaker Canvas เพื่อ สำรวจโซลูชันที่แตกต่างกันโดยอัตโนมัติและค้นหาโมเดลที่ดีที่สุดสำหรับชุดข้อมูลที่คุณกำหนด
ใช้ Amazon SageMaker Data Wrangler เพื่อ เลือกข้อมูล ทำความเข้าใจข้อมูลเชิงลึกของข้อมูล และแปลงข้อมูลเพื่อเตรียมข้อมูลสำหรับ ML
ใช้ Amazon SageMaker Experiments เพื่อ วิเคราะห์และเปรียบเทียบการทำซ้ำการฝึกอบรม ML เพื่อเลือกรุ่นที่มีประสิทธิภาพดีที่สุด
ใช้ Amazon SageMaker Clarify เพื่อตรวจจับและวัดความอคติที่อาจเกิดขึ้น ด้วยวิธีนี้ นักพัฒนา ML สามารถจัดการกับอคติที่อาจเกิดขึ้นและอธิบายการคาดคะเนโมเดลได้

เริ่มต้นด้วยการเรียนรู้ของเครื่องที่ได้รับการดูแลและไม่มีการดูแลบน AWS โดย การสร้างบัญชีวัน นี้

ขั้นตอนถัดไปกับ AWS

เริ่มต้นสร้างด้วยแมชชีนเลิร์นนิงภายใต้การดูแล

เรียนรู้วิธีเริ่มต้นใช้งาน Supervised Machine Learning บน AWS

เรียนรู้เพิ่มเติม

เริ่มสร้างด้วยแมชชีนเลิร์นนิงแบบไม่มีผู้ดูแล

เรียนรู้วิธีเริ่มต้นใช้งาน Machine Learning แบบไม่ได้รับการดูแลบน AWS