บัตรบริการ AWS AI อธิบายกรณีการใช้งานที่ตั้งใจให้บริการ วิธีการใช้แมชชีนเลิร์นนิง (ML) โดยบริการนั้น และข้อพิจารณาที่สำคัญในการออกแบบและการใช้บริการอย่างรับผิดชอบ บัตรบริการจะมีการพัฒนาขึ้นเมื่อ AWS ได้รับข้อเสนอแนะจากลูกค้า และเมื่อให้บริการซ้ำผ่านกระบวนการพัฒนา AWS แนะนำให้ลูกค้าประเมินประสิทธิภาพของบริการ AI ใดๆ บนเนื้อหาของตนเองสำหรับกรณีการใช้งานแต่ละกรณีที่พวกเขาต้องการแก้ไข สำหรับข้อมูลเพิ่มเติม โปรดดูคู่มือการใช้แมชชีนเลิร์นนิงอย่างมีความรับผิดชอบของ AWS และข้อมูลอ้างอิงในตอนท้าย โปรดอย่าลืมตรวจสอบนโยบายการใช้ AI อย่างมีความรับผิดชอบของ AWS และข้อกำหนดการใช้งานบริการ AWS สำหรับบริการที่คุณจะใช้งาน
การ์ดบริการนี้ใช้กับ Rekognition Face Matching เวอร์ชันปัจจุบัน ณ วันที่ 07/11/2022
ภาพรวม
Amazon Rekognition Face Matching ช่วยให้ผู้สร้างแอปพลิเคชันสามารถวัดความคล้ายคลึงกันระหว่างภาพของใบหน้าหนึ่งกับภาพใบหน้าที่สองได้ บัตรบริการ AI นี้อธิบายถึงข้อพิจารณาสำหรับการจับคู่ใบหน้าอย่างรับผิดชอบในภาพถ่ายสำหรับการระบุตัวตนทั่วไปและในสื่อ (เช่น ภาพยนตร์ อัลบั้มรูปภาพ และภาพแบบ “สด” ที่บันทึกในสภาพแวดล้อมที่ไม่สามารถควบคุมหรือเป็นธรรมชาติ) โดยใช้ CompareFaces และ SearchFaces API ของเรา โดยปกติ ลูกค้าจะใช้ CompareFaces สำหรับการเปรียบเทียบใบหน้าต้นฉบับกับใบหน้าเป้าหมาย (การจับคู่ 1:1) และ SearchFaces สำหรับการเปรียบเทียบใบหน้าต้นฉบับกับคอลเลกชันใบหน้าเป้าหมาย (การจับคู่ 1:N) Rekognition ไม่ได้มีคอลเลกชันใบหน้าที่สร้างไว้ล่วงหน้าให้แก่ลูกค้า ลูกค้าต้องสร้างและเติมคอลเลกชันใบหน้าของตนเอง ตลอดทั้งบัตรนี้ เราจะใช้ “การจับคู่ใบหน้า” เพื่ออ้างถึง CompareFaces API และ SearchFaces API ของ Rekognition
ภาพใบหน้าคู่หนึ่งถือว่า “ตรงกันจริง” หากภาพทั้งสองมีใบหน้าของบุคคลเดียวกัน และ “ไม่ตรงกันจริง” หากเป็นอย่างอื่น เมื่อได้รับภาพในคู่อินพุตของ “ต้นฉบับ” และ “เป้าหมาย” Rekognition จะส่งกลับคะแนนสำหรับความคล้ายคลึงกันของใบหน้าต้นฉบับในภาพต้นฉบับ กับใบหน้าเป้าหมายในภาพเป้าหมาย คะแนนความคล้ายคลึงกันขั้นต่ำคือ 0 ซึ่งหมายถึงความคล้ายคลึงกันน้อยมากและสูงสุดคือ 100 ซึ่งหมายถึงความคล้ายคลึงกันสูงมาก Rekognition เองไม่ได้ตัดสินใจอย่างอิสระว่าใบหน้าสองใบจากภาพนั้นตรงกันจริงหรือไม่ตรงกันจริง เวิร์กโฟลว์ของลูกค้าที่เรียกว่า CompareFaces และ/หรือ SearchFaces จะตัดสินโดยใช้ตรรกะอัตโนมัติ (โดยการตั้งค่าเกณฑ์ความคล้ายคลึงกันระหว่าง 0 ถึง 100 และคาดการณ์การตรงกันจริงหากคะแนนความคล้ายคลึงเกินเกณฑ์) การตัดสินของมนุษย์ หรือทั้งสองอย่างรวมกัน
ใบหน้าของมนุษย์มีความแตกต่างกันทางกายภาพ เช่น ตามสีผิวและรูปทรงเรขาคณิต อย่างไรก็ตาม บุคคลใดคนหนึ่งสามารถแสดงได้ด้วยภาพที่แตกต่างกัน และในทางกลับกันบุคคลที่ไม่ใช่คนเดียวกันก็อาจแสดงได้ด้วยภาพที่คล้ายกันมาก ตัวอย่างเช่น บุคคลสองคนที่มีเพียงรูปร่างของดวงตาเท่านั้นที่แตกต่างกัน อาจดูเหมือนกันหากสวมแว่นกันแดดคู่เดียวกัน เนื่องจากมีปัจจัยที่เป็นไปได้มากมาย (เรียกว่า “ความแปรปรวนที่สับสน”) ที่รวมกันเพื่อเปลี่ยนตำแหน่งและสีของพิกเซลภาพที่แสดงถึงใบหน้า ปัจจัยความสับสนเหล่านี้ ได้แก่ (1) การกระจายทิศทางแสง ความเข้มและความยาวคลื่น (2) การวางศีรษะ (3) ข้อบกพร่องในการโฟกัสและการถ่ายภาพ (4) ความละเอียดพิกเซล (5) การบดบังด้วยมือ หนวดเครา เส้นผม โทรศัพท์มือถือ ลิ้นที่แลบออกมา ผ้าพันคอ แว่นตา หมวก เครื่องประดับ หรือวัตถุอื่นๆ (6) การแสดงออกทางใบหน้า (7) การเปลี่ยนแปลงโทนสีผิว (เช่น โดยการแต่งหน้า ทาสีใบหน้า การถูกแดดเผา หรือสิว) คะแนนความคล้ายคลึงกันของ Rekognition ได้รับการออกแบบให้ต่ำสำหรับภาพใบหน้าของบุคคลที่แตกต่างกันและสูงสำหรับภาพของใบหน้าเดียวกัน โดยเพิกเฉยต่อความแปรปรวนที่สับสน Rekognition ใช้ข้อมูลที่มีอยู่ในภาพต้นฉบับและเป้าหมายเท่านั้น เพื่อประเมินความคล้ายคลึงกันของภาพใบหน้าของมนุษย์
กรณีการใช้งานและข้อจำกัดที่ตั้งไว้
Rekognition face matching มีวัตถุประสงค์เพื่อเปรียบเทียบใบหน้าของมนุษย์เท่านั้น ไม่รองรับการจดจำใบหน้าจากการ์ตูน ตัวละครเคลื่อนไหว หรือสิ่งมีชีวิตที่ไม่ใช่มนุษย์ นอกจากนี้ ยังไม่รองรับการใช้ภาพใบหน้าที่พร่ามัวและหยาบเกินกว่าที่มนุษย์สามารถจดจำใบหน้าได้ หรือใบหน้าที่ถูกบดบังด้วยเส้นผม มือ และวัตถุอื่นๆ เป็นส่วนใหญ่ นอกจากนี้ AWS ยังได้ใช้การระงับการใช้งานของตำรวจของ Rekognition::CompareFaces และ Rekognition::SearchFaces API เป็นส่วนหนึ่งของการสอบสวนทางอาญา (ดูส่วนที่ 50.9 ของข้อกำหนดการใช้งานบริการ AWS สำหรับข้อมูลเพิ่มเติม)
Rekognition face matching ช่วยให้สามารถใช้งานได้หลายอย่าง เช่น การระบุเด็กที่หายไป การอนุญาตให้เข้าถึงอาคารหรือห้องพักต้อนรับการประชุม การยืนยันตัวตนทางออนไลน์ และการจัดระเบียบห้องสมุดภาพส่วนตัว แอปพลิเคชันเหล่านี้แตกต่างกันไปตามจำนวนบุคคลที่เกี่ยวข้อง จำนวนภาพที่แตกต่างกันสำหรับแต่ละบุคคล จำนวนความแปรปรวนที่สับสนที่คาดหวัง ต้นทุนสัมพัทธ์ของการตรงกันเท็จและการไม่ตรงกันเท็จ และปัจจัยอื่นๆ เราจัดระเบียบแอปพลิเคชันเหล่านี้ออกเป็นสองกรณีการใช้งานอย่างกว้าง
กรณีการใช้งานในการยืนยันข้อมูลระบุตัวตน: แอปพลิเคชันการยืนยันข้อมูลระบุตัวตนใช้การจับคู่ใบหน้าเพื่อติดตั้งผู้ใช้ใหม่และให้ผู้ใช้ที่มีอยู่เข้าถึงทรัพยากรได้ ในกรณีการใช้งานนี้ สามารถลดความแปรปรวนที่สับสนได้โดยการใช้ภาพถ่ายจากบัตรประจำตัวที่ออกโดยรัฐบาล (เช่น หนังสือเดินทางและใบอนุญาตขับขี่) และการเซลฟี่แบบเรียลไทม์ที่ให้หันหน้าตรงแสงสว่างเพียงพอและไม่ถูกบดบัง ซึ่งช่วยให้แต่ละบุคคลในคอลเลกชันเป้าหมายสามารถแสดงได้ด้วยภาพใบหน้าจำนวนเล็กน้อย และช่วยให้มีจำนวนบุคคลที่แตกต่างกันในคอลเลกชันมีขนาดใหญ่ขึ้นได้ (เช่น เป็นล้านคน) ในกรณีการใช้งานนี้ ผู้ใช้ปลายทางบางคนอาจพยายามหลอกลวงระบบเพื่อให้ได้รับการเข้าถึง ดังนั้นลูกค้าอาจลดความเสี่ยงนี้ได้ ตัวอย่างเช่น ตรวจสอบด้วยตนเองว่าภาพต้นฉบับและภาพเป้าหมายที่ส่งไปยัง Rekognition ตรงตามความคาดหวังของลูกค้า และ/หรือจำเป็นต้องให้การจับคู่มีคะแนนความคล้ายคลึงกันสูง (เช่น 95)
กรณีการใช้สื่อ: แอปพลิเคชันสื่อใช้การจับคู่ใบหน้าเพื่อระบุบุคคลในภาพถ่ายและวิดีโอจากชุดบุคคลที่รู้จัก (ตัวอย่างเช่นการค้นหาสมาชิกในครอบครัวในวิดีโอวันหยุด) ในกรณีการใช้งานนี้ มีความแปรปรวนที่สับสนระหว่างภาพต้นฉบับและภาพเป้าหมายของบุคคลเดียวกันสูง ดังนั้นคอลเลกชันเป้าหมายอาจมีบุคคลน้อยลงโดยที่มีจำนวนภาพต่อผู้ใช้มากขึ้น (อาจครอบคลุมเวลาหลายปีในชีวิตของบุคคลนั้น) ในกรณีการใช้งานเช่นนี้จะมีแรงจูงใจของผู้ใช้ปลายทางในการพยายามหลอกระบบน้อยกว่า ดังนั้นลูกค้าอาจเลือกที่จะมีเวิร์กโฟลว์อัตโนมัติสูง และเนื่องจากความแปรปรวนที่สับสนสูง อาจยอมให้การจับคู่มีคะแนนความคล้ายคลึงกันต่ำลงได้ (ตัวอย่างเช่น 80)
การออกแบบของ Rekognition Face Matching
แมชชีนเลิร์นนิง: Rekognition Face Matching สร้างขึ้นโดยใช้เทคโนโลยีคอมพิวเตอร์วิชันและ ML โดยมีหลักการทำงานดังนี้: (1) ค้นหาส่วนของภาพอินพุตที่มีใบหน้า (2) แยกบริเวณภาพที่มีศีรษะและจัดตำแหน่งบริเวณนั้นเพื่อให้ใบหน้าอยู่ในตำแหน่งแนวตั้ง “ปกติ” แล้วส่งออกภาพที่ตัดเหลือเพียงใบหน้า (3) แปลงภาพใบหน้าที่ถูกตัดแต่ละภาพเป็น “เวกเตอร์ใบหน้า” (การแสดงทางคณิตศาสตร์ของภาพใบหน้าในทางเทคนิค) โปรดทราบว่าคอลเลกชันที่ค้นหาโดย SearchFaces เป็นชุดของเวกเตอร์ใบหน้า ไม่ใช่ชุดภาพใบหน้า (4) เปรียบเทียบเวกเตอร์ใบหน้าต้นฉบับและเป้าหมาย และส่งกลับคะแนนความคล้ายคลึงกันของระบบสำหรับเวกเตอร์ใบหน้า ดูเอกสารสำหรับนักพัฒนาสำหรับรายละเอียดของการเรียกใช้ API
ความคาดหวังด้านประสิทธิภาพ: ความแปรปรวนของแต่ละบุคคลและที่สับสนจะแตกต่างกันไปตามแอปพลิเคชันของลูกค้า ซึ่งหมายความว่าประสิทธิภาพจะแตกต่างกันไปตามแอปพลิเคชันแม้ว่าจะรองรับกรณีการใช้งานเดียวกันก็ตาม พิจารณาแอปพลิเคชันการยืนยันข้อมูลระบุตัวตนสองแอป A และ B โดยผู้ใช้จะลงทะเบียนข้อมูลระบุตัวตนด้วยภาพแบบหนังสือเดินทาง และยืนยันข้อมูลระบุตัวตนโดยใช้การเซลฟี่แบบเรียลไทม์ในภายหลัง แอปพลิเคชัน A อนุญาตการเข้าถึงสมาร์ทโฟนโดยใช้กล้องสมาร์ทโฟนเพื่อบันทึกภาพเซลฟี่ที่มีแสงสว่างเพียงพอ โฟกัสได้ดี หันหน้าตรง ความละเอียดสูง และไม่ถูกบดบัง แอปพลิเคชัน B อนุญาตการเข้าสู่อาคารได้โดยใช้กล้องทางเข้าเพื่อบันทึกภาพเซลฟี่ที่มีแสงน้อยกว่า เบลอมากกว่า และความละเอียดต่ำกว่า เนื่องจาก A และ B มีอินพุตที่ต่างกัน ทั้งสองแอปจึงมีอัตราข้อผิดพลาดในการจับคู่ใบหน้าที่แตกต่างกัน แม้ว่าแต่ละแอปพลิเคชันจะถูกนำไปใช้จริงได้อย่างสมบูรณ์แบบโดยใช้ Rekognition ก็ตาม
วิธีการที่ขับเคลื่อนโดยการทดสอบ: เราใช้ชุดข้อมูลหลายชุดเพื่อประเมินประสิทธิภาพ ชุดข้อมูลการประเมินเพียงชุดเดียวไม่สามารถแสดงภาพที่แท้จริงของประสิทธิภาพได้ นั่นเป็นเพราะชุดข้อมูลการประเมินจะแตกต่างกันไปตามองค์ประกอบเชิงประชากร (จำนวนและประเภทของกลุ่มที่กำหนด) ปริมาณของรูปแบบที่สับสน (คุณภาพของเนื้อหา ความตรงตามวัตถุประสงค์) ประเภทและคุณภาพของป้ายกำกับที่มีอยู่ และปัจจัยอื่นๆ เราวัดประสิทธิภาพ Rekognition โดยการทดสอบในชุดข้อมูลการประเมินที่มีภาพคู่ของบุคคลเดียวกัน (คู่ที่ตรงกัน) และภาพคู่ของบุคคลที่แตกต่างกัน (คู่ที่ไม่ตรงกัน) เราเลือกเกณฑ์ความคล้ายคลึงกัน ใช้ Rekognition เพื่อคำนวณคะแนนความคล้ายคลึงกันของแต่ละคู่ และกำหนดว่าคู่นั้นเป็นคู่ที่ตรงกันหรือไม่ตรงกันตามเกณฑ์ที่กำหนด ประสิทธิภาพโดยรวมในชุดข้อมูลแสดงด้วยตัวเลขสองตัวคือ อัตราการตรงกันจริง (เปอร์เซ็นต์ของคู่ที่ตรงกันที่มีความคล้ายคลึงกันสูงกว่าเกณฑ์) และอัตราการไม่ตรงกันจริง (เปอร์เซ็นต์ของคู่ที่ไม่ตรงกันที่มีคะแนนความคล้ายคลึงกันต่ำกว่าเกณฑ์) การเปลี่ยนเกณฑ์ความคล้ายคลึงกันจะเปลี่ยนอัตราการตรงกันจริงและอัตราการไม่ตรงกันจริง กลุ่มในชุดข้อมูลสามารถกำหนดได้โดยคุณลักษณะเชิงประชากร (เช่น เพศ) ตัวแปรที่สับสน (เช่น การมีหรือไม่มีหนวดเคราบนใบหน้า) หรือทั้งสองอย่างรวมกัน ชุดข้อมูลการประเมินจะแตกต่างกันไปตามปัจจัยเหล่านี้และปัจจัยอื่นๆ ด้วยเหตุนี้ คะแนนอัตราการตรงกันจริงและอัตราการไม่ตรงกัน ทั้งโดยรวมและสำหรับกลุ่ม จึงแตกต่างกันไปในชุดข้อมูลแต่ละชุด เมื่อคำนึงถึงความแปรปรวนนี้ กระบวนการพัฒนาของเราจะตรวจสอบประสิทธิภาพของ Rekognition โดยใช้ชุดข้อมูลการประเมินหลายชุด ดำเนินการตามขั้นตอนเพื่อเพิ่มคะแนนอัตราการตรงกันจริงและ/หรืออัตราการไม่ตรงกันจริงสำหรับกลุ่มที่ Rekognition ทำงานได้ดีน้อยที่สุด ทำงานเพื่อปรับปรุงชุดของชุดข้อมูลการประเมินผล จากนั้นทำซ้ำ
ความยุติธรรมและอคติ: เป้าหมายของเราคือ ทำให้ Rekognition face matching ทำงานได้ดีกับใบหน้าของมนุษย์ทุกคน เพื่อให้บรรลุเป้าหมายนี้เราใช้กระบวนการพัฒนาซ้ำดังที่อธิบายไว้ข้างต้น ในฐานะที่เป็นส่วนหนึ่งของกระบวนการ เราสร้างชุดข้อมูลที่บันทึกภาพใบหน้าและสีผิวของมนุษย์ที่หลากหลายภายใต้ความแปรปรวนที่สับสนจำนวนมาก เราทดสอบทุกกรณีการใช้งานเป็นประจำบนชุดข้อมูลของภาพใบหน้าซึ่งเรามีป้ายกำกับเชิงประชากรที่เชื่อถือได้ เช่น เพศ อายุ และสีผิว เราพบว่า Rekognition ทำงานได้ดีในคุณลักษณะเชิงประชากร ตัวอย่างเช่น Credo AI ซึ่งเป็นบริษัทที่เชี่ยวชาญใน AI ที่รับผิดชอบได้ทำการประเมิน Rekognition ของบุคคลที่สามโดยใช้ชุดข้อมูลการยืนยันข้อมูลตัวตนที่มีภาพคุณภาพสูงของตัวแบบที่มีแสงที่ดี ไม่เบลอและไม่ถูกบดบัง Credo AI สังเกตว่าอัตราการตรงกันจริงต่ำสุดคือ 99.94816% ในกลุ่มประชากรหกกลุ่มที่กำหนดโดยสีผิวและเพศ และอัตราการไม่ตรงกันจริงต่ำที่สุดในทั้งหกกลุ่มคือ 99.99995% โดยมีเกณฑ์ความคล้ายคลึงกันตั้งไว้ที่ 95 เนื่องจากผลการดำเนินงานขึ้นอยู่กับปัจจัยที่หลากหลาย รวมไปถึง Rekognition, เวิร์กโฟลว์ของลูกค้า และชุดข้อมูลการประเมิน เราจึงขอแนะนำให้ลูกค้าทำการทดสอบ Rekognition เพิ่มเติมโดยใช้เนื้อหาของตนเอง
ความสามารถในการอธิบายได้: หากลูกค้ามีคำถามเกี่ยวกับคะแนนความคล้ายคลึงกันที่ Rekognition ส่งกลับสำหรับคู่ภาพต้นฉบับและเป้าหมายที่กำหนด เราขอแนะนำให้ลูกค้าใช้กล่องขอบเขตและข้อมูลตำแหน่งสำคัญบนใบหน้าที่ Rekognition ส่งกลับมาเพื่อตรวจสอบภาพใบหน้าโดยตรง
ความครอบคลุม: เราเพิ่มความครอบคลุมสูงสุดด้วยเทคนิคหลายอย่าง รวมถึงการใช้ชุดข้อมูลการฝึกขนาดใหญ่ที่บันทึกความความแตกต่างหลายรูปแบบของบุคคลจำนวนมาก เนื่องจาก Rekognition ไม่สามารถใช้ความละเอียดในการแยกแยะสูงมากต่อความแตกต่างเล็กน้อยระหว่างบุคคลที่แตกต่างกัน (เช่น ฝาแฝดที่เหมือนกัน) และใช้ความละเอียดในการแยกแยะต่ำมากต่อการเปลี่ยนแปลงที่สับสน (เช่น การแต่งหน้าเพื่อปรับปรุงโหนกแก้ม) ในเวลาเดียวกันได้ ลูกค้าจึงต้องกำหนดความคาดหวังสำหรับอัตราการตรงกันจริงและอัตราการไม่ตรงกันจริงตามความเหมาะสมกับกรณีการใช้งาน และทดสอบประสิทธิภาพของเวิร์กโฟลว์ รวมถึงการเลือกเกณฑ์ความคล้ายคลึงกันในเนื้อหาของตนเอง
ความเป็นส่วนตัวและความปลอดภัย: Rekognition Face Matching จะประมวลผลข้อมูลสามประเภท ได้แก่ ภาพอินพุตของลูกค้า เวกเตอร์ใบหน้าของภาพอินพุต และคะแนนความคล้ายคลึงกันของเอาต์พุตและข้อมูลเมตาเอาต์พุต เวกเตอร์ใบหน้าจะไม่รวมอยู่ในผลลัพธ์ที่ส่งกลับโดยบริการ เราจะไม่แบ่งปันอินพุตและเอาต์พุตกับลูกค้ารายอื่น ลูกค้าสามารถเลือกไม่เข้าร่วมการฝึกอบรมเกี่ยวกับเนื้อหาของลูกค้าได้ทาง AWS Organizations หรือวิธีไม่เข้าร่วมอื่นๆ ที่เราอาจมีให้ ดูข้อมูลเพิ่มเติมในส่วนที่ 50.3 ของข้อกำหนดการให้บริการ AWS และคำถามที่พบบ่อยเกี่ยวกับความเป็นส่วนตัวของข้อมูลบน AWS สำหรับข้อมูลความเป็นส่วนตัวและการรักษาความปลอดภัยเฉพาะบริการ โปรดดูส่วนความเป็นส่วนตัวของข้อมูลในคำถามที่พบบ่อยเกี่ยวกับ Rekognition และเอกสารประกอบสำหรับการรักษาความปลอดภัยของ Amazon Rekognition
ความโปร่งใส: ลูกค้าที่รวม Amazon Rekognition Face Matching API ไว้ในเวิร์กโฟลว์ ควรพิจารณาเปิดเผยการใช้ ML และเทคโนโลยีการจดจำใบหน้าให้กับผู้ใช้ปลายทางและบุคคลอื่นๆ ที่ได้รับผลกระทบจากการใช้งาน และให้ผู้ใช้ปลายทางสามารถให้ข้อเสนอแนะเพื่อปรับปรุงเวิร์กโฟลว์ได้ หากเหมาะสมสำหรับกรณีการใช้งาน ลูกค้ายังสามารถอ้างอิงบัตรบริการ AI นี้ได้ในเอกสารของพวกเขา
การกำกับดูแล: เรามีวิธีการที่เข้มงวดในการสร้างบริการ AWS AI ของเราอย่างรับผิดชอบ รวมไปถึงกระบวนการพัฒนาผลิตภัณฑ์ที่ทำงานย้อนกลับซึ่งรวม AI ที่รับผิดชอบในขั้นตอนการออกแบบ การให้คำปรึกษาด้านการออกแบบและการประเมินการใช้งานโดยผู้เชี่ยวชาญด้านวิทยาศาสตร์และข้อมูล AI ที่รับผิดชอบ การทดสอบตามปกติ การตรวจสอบร่วมกับลูกค้า และการพัฒนาแนวทางปฏิบัติที่ดีที่สุด การเผยแพร่ และการฝึกอบรมด้วย
แนวทางปฏิบัติที่ดีที่สุดในการนำไปใช้จริงและการเพิ่มประสิทธิภาพการทำงาน
- ความแปรปรวนของแต่ละบุคคล: เมื่อค้นหาใบหน้าต้นฉบับในคอลเลกชันใบหน้าเป้าหมาย ความสำเร็จจะเพิ่มขึ้นตามระดับความแตกต่างทางกายภาพระหว่างบุคคลที่แตกต่างกันในชุดเป้าหมาย ตัวอย่างเช่น การจับคู่ระหว่างฝาแฝดที่เหมือนกันนั้นยากกว่าการจับคู่ระหว่างฝาแฝดพี่น้องหรือบุคคลที่ไม่เกี่ยวข้องกันอย่างมีนัยสำคัญ โดยทั่วไป คอลเลกชันเป้าหมายที่มีบุคคลที่ไม่ซ้ำกันจำนวนมากจะมีความเสี่ยงสูงกว่าที่จะมีบุคคลที่ไม่ซ้ำกันสองคนที่ดูคล้ายคลึงกัน และต้องการความระมัดระวังมากขึ้นเมื่อตัดสินใจขั้นสุดท้ายเกี่ยวกับการจับคู่ เวิร์กโฟลว์ควรพิจารณาความคล้ายคลึงกันที่เป็นไปได้ของบุคคลในคอลเลกชันเป้าหมายเมื่อตีความคะแนนความคล้ายคลึงกันที่ส่งกลับสำหรับภาพต้นฉบับ
- ความแปรปรวนที่สับสน: เมื่อเลือกคู่ของภาพต้นฉบับและภาพเป้าหมาย เวิร์กโฟลว์ควรมีขั้นตอนเพื่อลดความแปรปรวนระหว่างภาพต้นฉบับและภาพเป้าหมาย (เช่นความแตกต่างในสภาพแสง) หากความแปรปรวนสูง ให้พิจารณาเพิ่มภาพใบหน้าหลายภาพ (“ตัวเลือก”) สำหรับแต่ละบุคคลเป้าหมายที่ครอบคลุมรูปแบบที่คาดหวัง (เช่น ท่าทาง แสงสว่าง และอายุ) และเปรียบเทียบภาพใบหน้าต้นฉบับกับแต่ละตัวเลือกเป้าหมาย หากมีเพียงตัวเลือกเดียวที่ใช้ได้ ให้พิจารณาใช้ภาพแบบหนังสือเดินทาง หันหน้าตรงและไม่ถูกบดบัง เวิร์กโฟลว์ควรกำหนดนโยบายสำหรับภาพอินพุตที่อนุญาตและตรวจสอบการปฏิบัติตามข้อกำหนดโดยการสุ่มตัวอย่างอินพุตทั้งแบบเป็นระยะและแบบสุ่ม
- เกณฑ์ความคล้ายคลึงกัน: สิ่งสำคัญคือต้องกำหนดเกณฑ์ความคล้ายคลึงกันที่เหมาะสมสำหรับแอปพลิเคชัน มิฉะนั้นเวิร์กโฟลว์อาจสรุปได้ว่ามีการจับคู่ทั้งที่ไม่มี (การตรงกันเท็จ) หรือในทางกลับกัน (การไม่ตรงกันเท็จ) ค่าใช้จ่ายของการตรงกันเท็จอาจไม่เท่ากับค่าใช้จ่ายของการไม่ตรงกันเท็จ ตัวอย่างเช่น เกณฑ์ความคล้ายคลึงกันที่เหมาะสมสำหรับการยืนยันตัวตนอาจสูงกว่าสำหรับใช้กับสื่อมาก ในการกำหนดเกณฑ์ความคล้ายคลึงกันที่เหมาะสม ลูกค้าควรรวบรวมชุดคู่อินพุตที่เป็นตัวแทน ป้ายกำกับแต่ละคู่ว่าตรงกันหรือไม่ตรงกัน และลองใช้เกณฑ์ความคล้ายคลึงกันที่สูงขึ้นหรือต่ำลงจนกว่าจะพอใจ
- การกำกับดูแลของมนุษย์: หากเวิร์กโฟลว์แอปพลิเคชันของลูกค้าเกี่ยวข้องกับกรณีการใช้งานที่มีความเสี่ยงสูงหรือมีความละเอียดอ่อน เช่น การตัดสินใจที่มีผลต่อสิทธิหรือการเข้าถึงบริการที่สำคัญของบุคคล เราขอแนะนำให้มีการตรวจสอบจากมนุษย์ไว้ในเวิร์กโฟลว์แอปพลิเคชันตามความเหมาะสมด้วย ระบบจับคู่ใบหน้าสามารถทำหน้าที่เป็นเครื่องมือในการลดความพยายามที่เกิดขึ้นจากการแก้ปัญหาด้วยตนเองได้อย่างเต็มรูปแบบ และช่วยให้มนุษย์สามารถตรวจสอบและประเมินการจับคู่ที่อาจตรงกันและไม่ตรงกันอย่างรวดเร็ว
- ความสอดคล้องกัน: ลูกค้าควรกำหนดและบังคับใช้นโยบายสำหรับประเภทของภาพต้นฉบับและภาพเป้าหมายที่ได้รับอนุญาต และวิธีที่มนุษย์รวมการใช้เกณฑ์ความคล้ายคลึงกันและการตัดสินของตนเองเพื่อกำหนดการจับคู่ นโยบายเหล่านี้ควรมีความสอดคล้องกันในกลุ่มประชากรทั้งหมด การปรับแต่งภาพต้นฉบับและเป้าหมายหรือเกณฑ์ความคล้ายคลึงกันที่ไม่มีความสอดคล้องอาจส่งผลให้เกิดผลลัพธ์ที่ไม่ยุติธรรมสำหรับกลุ่มประชากรที่แตกต่างกัน
- การเปลี่ยนแปลงของประสิทธิภาพ: การเปลี่ยนแปลงประเภทของภาพที่ลูกค้าส่งไปยัง Rekognition หรือการเปลี่ยนแปลงบริการอาจนำไปสู่ผลลัพธ์ที่แตกต่างกัน เพื่อแก้ไขการเปลี่ยนแปลงเหล่านี้ ลูกค้าควรพิจารณาทดสอบประสิทธิภาพของ Rekognition ซ้ำเป็นระยะๆ และปรับเวิร์กโฟลว์ หากจำเป็น
ข้อมูลเพิ่มเติม
- สำหรับเอกสารบริการ โปรดดูที่ Rekognition, CompareFaces, SearchFaces
- สำหรับตัวอย่างของการออกแบบเวิร์กโฟลว์การยืนยันข้อมูลระบุตัวตน โปรดดูการยืนยันข้อมูลระบุตัวตนโดยใช้ Amazon Rekognition
- สำหรับรายละเอียดเกี่ยวกับความเป็นส่วนตัวและข้อพิจารณาทางกฎหมายอื่นๆ โปรดดูกฎหมาย การปฏิบัติตามข้อกำหนด ความเป็นส่วนตัว
- สำหรับความช่วยเหลือในการเพิ่มประสิทธิภาพเวิร์กโฟลว์ โปรดดูที่ฝ่ายสนับสนุนลูกค้า AWS, AWS Professional Services, Amazon SageMaker Ground Truth Plus, Amazon Augmented AI
- หากคุณมีคำถามหรือข้อเสนอแนะเกี่ยวกับการ์ดบริการ AWS AI โปรดกรอกแบบฟอร์มนี้
อภิธานศัพท์
ความยุติธรรมและอคติ หมายถึงวิธีที่ระบบ AI ส่งผลกระทบต่อกลุ่มย่อยของผู้ใช้ที่แตกต่างกัน (เช่น ตามเพศ เชื้อชาติ)
ความสามารถในการอธิบายได้ หมายถึงการมีกลไกในการทำความเข้าใจและประเมินผลลัพธ์ของระบบ AI
ความครอบคลุม หมายถึงการมีกลไกเพื่อให้แน่ใจว่าระบบ AI ทำงานได้อย่างน่าเชื่อถือ
ความเป็นส่วนตัวและความปลอดภัย หมายถึงข้อมูลที่ได้รับการปกป้องจากการโจรกรรมและการถูกเปิดเผย
การกำกับดูแลหมายถึง การมีกระบวนการในการกำหนด การนำไปใช้ และบังคับใช้แนวทางปฏิบัติ AI ที่รับผิดชอบภายในองค์กร
ความโปร่งใส หมายถึงการสื่อสารข้อมูลเกี่ยวกับระบบ AI เพื่อให้ผู้มีส่วนได้ส่วนได้เสียสามารถมีข้อมูลในการเลือกเกี่ยวกับการใช้อุปกรณ์ได้