การปกปิดข้อมูลคืออะไร

การปกปิดข้อมูลเป็นกระบวนการซ่อนข้อมูลโดยการแก้ไขตัวอักษรและตัวเลขเดิม เนื่องจากข้อกำหนดด้านกฎระเบียบและความเป็นส่วนตัว องค์กรต้องปกป้องข้อมูลที่ละเอียดอ่อนที่รวบรวมเกี่ยวกับลูกค้าและการดำเนินงานของตน การปกปิดข้อมูลจะสร้างข้อมูลปลอมขององค์กรโดยเปลี่ยนข้อมูลที่เป็นความลับ มีการใช้เทคนิคต่างๆ เพื่อสร้างการเปลี่ยนแปลงที่เหมือนจริงและมีโครงสร้างคล้ายคลึงกัน เมื่อข้อมูลถูกปกปิดแล้ว คุณจะไม่สามารถย้อนกลับหรือติดตามค่าข้อมูลเดิมโดยไม่ต้องเข้าถึงชุดข้อมูลเดิม

กรณีการใช้งานของการปกปิดข้อมูลมีอะไรบ้าง

เทคนิคการปกปิดข้อมูลสนับสนุนความพยายามขององค์กรในการปฏิบัติตามข้อบังคับด้านความเป็นส่วนตัวของข้อมูล เช่น ระเบียบการคุ้มครองข้อมูลทั่วไป (GDPR) คุณสามารถปกป้องข้อมูลได้หลายประเภท เช่น ข้อมูลที่ระบุตัวตนของบุคคลได้ (PII) ข้อมูลทางการเงิน ข้อมูลสุขภาพที่ได้รับการคุ้มครอง (PHI) และทรัพย์สินทางปัญญา

ต่อไป เราจะสำรวจกรณีการใช้งานการปกปิดข้อมูลบางส่วน

การพัฒนาที่ปลอดภัย

การพัฒนาซอฟต์แวร์และสภาพแวดล้อมการทดสอบจำเป็นต้องมีชุดข้อมูลจริงเพื่อวัตถุประสงค์ในการทดสอบ อย่างไรก็ตาม การใช้ข้อมูลจริงทำให้เกิดความกังวลด้านความปลอดภัย การปิดบังข้อมูลช่วยให้นักพัฒนาและผู้ทดสอบสามารถทำงานกับข้อมูลการทดสอบที่เหมือนจริงซึ่งคล้ายกับต้นฉบับ แต่ไม่มีการเปิดเผยข้อมูลที่ละเอียดอ่อน ช่วยลดความเสี่ยงด้านความปลอดภัยในรอบการพัฒนาและการทดสอบ

การวิเคราะห์และการวิจัย

การปกปิดข้อมูลช่วยให้นักวิทยาศาสตร์ข้อมูลและนักวิเคราะห์สามารถทำงานกับชุดข้อมูลขนาดใหญ่ได้โดยไม่กระทบต่อความเป็นส่วนตัวของแต่ละคน นักวิจัยได้รับข้อมูลเชิงลึกและแนวโน้มอันมีค่าจากข้อมูลและรับรองการปกป้องความเป็นส่วนตัว ตัวอย่างเช่น นักวิทยาศาสตร์สามารถใช้ชุดข้อมูลที่ไม่ระบุตัวตนเพื่อศึกษาประสิทธิผลของยาตัวใหม่ วิเคราะห์ผลการรักษา หรือตรวจสอบผลข้างเคียงที่อาจเกิดขึ้น

การทำงานร่วมกันภายนอก

องค์กรมักจะต้องแชร์ข้อมูลกับคู่ค้า ผู้ขาย หรือที่ปรึกษาภายนอก ด้วยการปกปิดฟิลด์หรือแอตทริบิวต์บางอย่าง องค์กรสามารถทำงานร่วมกับบุคคลภายนอกและยังคงปกป้องข้อมูลที่ละเอียดอ่อนได้

การฝึกอบรมพนักงาน

คุณสามารถใช้การปกปิดข้อมูลสำหรับเซสชันการฝึกอบรมพนักงานหรือการสาธิตซอฟต์แวร์ ด้วยการปกปิดข้อมูลที่ละเอียดอ่อน องค์กรสามารถให้ตัวอย่างที่เหมือนจริงโดยไม่ต้องเปิดเผยข้อมูลลูกค้าหรือธุรกิจที่แท้จริง พนักงานสามารถเรียนรู้และฝึกฝนทักษะโดยไม่จำเป็นต้องเข้าถึงข้อมูลที่ไม่ได้รับอนุญาต

การปกปิดข้อมูลมีกี่ประเภท

ต่อไป เราจะให้ประเภทการปิดบังข้อมูลทั่วไปบางประเภท

การปกปิดข้อมูลแบบคงที่

การปิดบังข้อมูลแบบคงที่เป็นกระบวนการของการใช้ชุดกฎการปิดบังแบบตายตัวกับข้อมูลที่ละเอียดอ่อนก่อนที่จะจัดเก็บหรือแชร์ โดยทั่วไปจะใช้กับข้อมูลที่ไม่เปลี่ยนแปลงบ่อยหรือคงที่เมื่อเวลาผ่านไป คุณกำหนดกฎล่วงหน้าและนำไปใช้กับข้อมูลอย่างสม่ำเสมอ ซึ่งทำให้แน่ใจได้ว่ามีการมาสก์ที่สอดคล้องกันในสภาพแวดล้อมต่างๆ

แม้ว่ารายละเอียดจะซับซ้อน แต่นี่คือภาพรวมของกระบวนการปิดบังข้อมูลแบบคงที่:

  1. ระบุและทำความเข้าใจข้อมูลที่ละเอียดอ่อน
  2. ออกแบบและพัฒนากฎการปกปิด
  3. เลือกอัลกอริทึมการปกปิดข้อมูลที่เหมาะสม
  4. ใช้กฎการปกปิดกับข้อมูลจริง

จากนั้นคุณสามารถแบ่งปันข้อมูลที่ปกปิดได้ตามต้องการ

การปกปิดข้อมูลแบบไดนามิก

การปิดบังข้อมูลแบบไดนามิกใช้เทคนิคการปิดบังแบบเรียลไทม์ โดยจะปรับเปลี่ยนข้อมูลที่ละเอียดอ่อนที่มีอยู่แบบไดนามิกเมื่อผู้ใช้เข้าถึงหรือสอบถาม ส่วนใหญ่จะใช้สำหรับการรักษาความปลอดภัยข้อมูลตามบทบาทในแอปพลิเคชัน เช่น การสนับสนุนลูกค้าหรือการจัดการเวชระเบียน

การปกปิดข้อมูลแบบไดนามิกทำงานดังนี้:

  1. ผู้ใช้ทั้งหมดสื่อสารกับฐานข้อมูลผ่านพร็อกซีเซิร์ฟเวอร์
  2. เมื่อผู้ใช้ขออ่านข้อมูล พร็อกซีฐานข้อมูลจะใช้กฎการปิดบังตามบทบาทผู้ใช้ สิทธิ์ หรือสิทธิ์การเข้าถึง
  3. ผู้ใช้ที่ได้รับอนุญาตจะได้รับข้อมูลต้นฉบับ ในขณะที่ผู้ใช้ที่ไม่ได้รับอนุญาตจะได้รับข้อมูลที่ปกปิดไว้

แม้ว่ากระบวนการนี้ไม่จำเป็นต้องมีการเตรียมการล่วงหน้า แต่อาจส่งผลกระทบต่อประสิทธิภาพการทำงาน

การปกปิดข้อมูลที่กำหนดไว้

การปกปิดข้อมูลที่กำหนดไว้ช่วยให้มั่นใจได้ว่าค่าอินพุตเดียวกันจะถูกปิดบังให้เป็นค่าเอาต์พุตเดียวกันอย่างสม่ำเสมอ ตัวอย่างเช่น หากชื่อใดชื่อหนึ่งถูกปกปิดด้วยคำว่า "John" ในหนึ่งรายการ ชื่อนั้นจะถูกสวมหน้ากากเป็น "John" ตลอดทั้งระบบ

เทคนิคการปกปิดแบบกำหนดไว้มักจะเกี่ยวข้องกับการแทนที่ข้อมูลหรือโทเค็น โดยที่การแม็ปที่สอดคล้องกันจะยังคงอยู่ระหว่างคอลัมน์ข้อมูลดั้งเดิมและค่าที่ปิดบัง

การปกปิดข้อมูลขณะใช้งาน

การปิดบังข้อมูลขณะใช้งานจะปกปิดข้อมูลที่ละเอียดอ่อนในหน่วยความจำ ดังนั้นจึงไม่มีข้อกำหนดในการจัดเก็บข้อมูลที่แก้ไขในฐานข้อมูล ซึ่งมีประโยชน์ในไปป์ไลน์การปรับใช้อย่างต่อเนื่องหรือในสถานการณ์การรวมระบบที่ซับซ้อน ซึ่งข้อมูลมักเคลื่อนย้ายระหว่างสภาพแวดล้อมการผลิตและสภาพแวดล้อมที่ไม่ใช่การผลิต ในขั้นตอนที่จำเป็นในไปป์ไลน์ แอปพลิเคชันจะปิดบังข้อมูล จากนั้นส่งต่อไปยังขั้นตอนถัดไปในไปป์ไลน์

การทำให้ข้อมูลยุ่งเหยิงทางสถิติ

การทำให้ข้อมูลยุ่งเหยิงทางสถิติเกี่ยวข้องกับการเปลี่ยนแปลงค่าของข้อมูลที่ละเอียดอ่อนในลักษณะที่รักษาคุณสมบัติทางสถิติและความสัมพันธ์ภายในข้อมูล ช่วยให้มั่นใจได้ว่าข้อมูลที่ปกปิดไว้จะรักษาการกระจาย รูปแบบ และความสัมพันธ์โดยรวมของข้อมูลต้นฉบับเพื่อการวิเคราะห์ทางสถิติที่แม่นยำ เทคนิคการทำให้ข้อมูลยุ่งเหยิงทางสถิติมีการใช้ฟังก์ชันทางคณิตศาสตร์หรืออัลกอริธึมการก่อกวนกับข้อมูล

เทคนิคการปกปิดข้อมูลทั่วไปมีอะไรบ้าง

มีอัลกอริธึมหลายอย่างที่คุณสามารถใช้เพื่อการปกป้องข้อมูล ต่อไปนี้เป็นวิธีการปกปิดข้อมูลทั่วไป

การสุ่ม

ด้วยการสุ่ม คุณแทนที่ข้อมูลที่ละเอียดอ่อนด้วยค่าที่สร้างแบบสุ่มที่ไม่มีความสัมพันธ์กับข้อมูลต้นฉบับ ตัวอย่างเช่น คุณสามารถแทนที่ชื่อ ที่อยู่ หรือข้อมูลส่วนบุคคลอื่นๆ ได้ด้วยค่าสมมติหรือค่าที่เลือกแบบสุ่ม

การทดแทน

การปกปิดด้วยการแทนที่เกี่ยวข้องกับการแทนที่ข้อมูลที่ละเอียดอ่อนด้วยข้อมูลที่คล้ายกันแต่เป็นข้อมูลสมมติ ตัวอย่างเช่น คุณสามารถแทนที่ชื่อจริงด้วยชื่อจากรายการที่กำหนดไว้ล่วงหน้า คุณยังสามารถใช้อัลกอริทึมเพื่อสร้างหมายเลขบัตรเครดิตที่คล้ายกันแต่เป็นของปลอมได้

สับเปลี่ยน

ด้วยการสับเปลี่ยน คุณจะจัดลำดับค่าใหม่ภายในชุดข้อมูลเพื่อรักษาคุณสมบัติทางสถิติและทำให้แต่ละระเบียนไม่สามารถระบุตัวตนได้ เทคนิคนี้มักใช้เพื่อรักษาความสัมพันธ์ภายในข้อมูล

ตัวอย่างเช่น ในตารางข้อมูล คุณสามารถสุ่มสุ่มข้อมูลคอลัมน์เพื่อให้ค่าแถวเปลี่ยนแปลงได้ ในทางปฏิบัติ คุณสามารถรักษาความสัมพันธ์ระหว่างลูกค้ากับการทำธุรกรรมของพวกเขาในขณะที่เปลี่ยนชื่อและรายละเอียดการติดต่อได้

การเข้ารหัส

ด้วยการปิดบังด้วยการเข้ารหัส คุณจะเข้ารหัสข้อมูลที่ละเอียดอ่อนโดยใช้อัลกอริทึมการเข้ารหัส คุณแปลงข้อมูลเป็นรูปแบบที่อ่านไม่ได้ และเฉพาะผู้ใช้ที่ได้รับอนุญาตซึ่งมีคีย์ถอดรหัสเท่านั้นที่สามารถเข้าถึงข้อมูลต้นฉบับได้ เทคนิคนี้ให้ระดับความปลอดภัยของข้อมูลที่สูงขึ้น แต่จะส่งผลต่อประสิทธิภาพการสืบค้นเนื่องจากจำเป็นต้องมีการถอดรหัสสำหรับการวิเคราะห์ข้อมูล

การแฮช

การแฮชเป็นเทคนิคการแปลงที่แปลงข้อมูลเป็นสตริงอักขระที่มีความยาวคงที่ โดยทั่วไปจะใช้เพื่อปกปิดรหัสผ่านหรือข้อมูลที่ละเอียดอ่อนอื่นๆ ซึ่งไม่จำเป็นต้องใช้ค่าดั้งเดิม และคุณเพียงแค่ต้องยืนยันข้อมูลเท่านั้น

การสร้างโทเค็น

ด้วยการสร้างโทเค็น คุณจะแทนที่ข้อมูลการผลิตด้วยโทเค็นหรือค่าอ้างอิงที่สร้างขึ้นแบบสุ่ม คุณจัดเก็บข้อมูลต้นฉบับไว้ในตำแหน่งที่ปลอดภัยแยกต่างหาก และใช้โทเค็นแทนระหว่างการประมวลผลหรือการวิเคราะห์ โทเค็นช่วยรักษาความสมบูรณ์ของข้อมูลในขณะที่ลดความเสี่ยงในการเปิดเผยข้อมูลที่ละเอียดอ่อน

การเว้นว่าง

การเว้นว่าง (หรือการเว้น) เป็นโซลูชันการปกปิดข้อมูลที่แทนที่ข้อมูลที่ละเอียดอ่อนด้วยค่า Null หรือช่องว่าง สิ่งนี้จะลบข้อมูลออกจากชุดข้อมูลอย่างมีประสิทธิภาพ วิธีการนี้เหมาะสมเมื่อคุณต้องการคงรูปแบบหรือโครงสร้างของข้อมูลไว้ แต่ข้อมูลเฉพาะต้องถูกปกปิด

อะไรคือความท้าทายในการปกปิดข้อมูล

ต่อไป เราจะพูดถึงความท้าทายทั่วไปบางประการในการปิดบังข้อมูล

การเก็บรักษาแอตทริบิวต์

เป็นสิ่งสำคัญสำหรับการวิจัยและการวิเคราะห์ว่าการปิดบังข้อมูลจะรักษาแอตทริบิวต์ข้อมูลดั้งเดิมสำหรับข้อมูลบางประเภท คุณต้องการให้แน่ใจว่าเครื่องมือปิดบังข้อมูลของคุณรักษาประเภทข้อมูลดั้งเดิมหรือรักษาความถี่ของประเภทข้อมูลที่เกี่ยวข้อง

ตัวอย่างเช่น หากเครื่องมือเปลี่ยนแปลงการแสดงข้อมูลประชากรของข้อมูลลูกค้าหรือสถิติหมวดหมู่บัตรเมื่อสร้างความสับสนให้กับรายละเอียดบัตรเครดิต สิ่งนี้อาจส่งผลกระทบต่อการวิเคราะห์ การเก็บรักษาแอตทริบิวต์จะกลายเป็นสิ่งที่ท้าทายในกระบวนการปกปิดข้อมูลบางอย่างเช่นการสุ่มหรือสร้างโทเค็น

ความสมบูรณ์เชิงความหมาย

ค่าปลอมที่สร้างขึ้นต้องเป็นไปตามกฎทางธุรกิจและข้อจำกัดที่เกี่ยวข้องกับข้อมูลประเภทต่างๆ ตัวอย่างเช่น เงินเดือนควรอยู่ในช่วงที่กำหนด และหมายเลขประจำตัวประชาชนควรเป็นไปตามรูปแบบที่กำหนดไว้ล่วงหน้า การรักษาความสมบูรณ์ของความหมายเป็นเรื่องท้าทาย แต่ต้องทำให้แน่ใจว่าข้อมูลที่ปกปิดยังคงมีความหมายและเป็นจริง

เอกลักษณ์ของข้อมูล

ในกรณีที่ข้อมูลต้นฉบับต้องการความซ้ำกัน เช่น หมายเลขรหัสพนักงาน เทคนิคการปกปิดข้อมูลจะต้องระบุค่าที่ไม่ซ้ำเพื่อแทนที่ข้อมูลเดิม การไม่มีเอกลักษณ์ในฟิลด์สำคัญอาจสร้างความขัดแย้งหรือไม่สอดคล้องกัน

การผสานรวมกับเวิร์กโฟลว์ที่มีอยู่

การผสมผสานการปกปิดข้อมูลเข้ากับเวิร์กโฟลว์ที่มีอยู่อาจเป็นเรื่องยาก โดยเฉพาะอย่างยิ่งในช่วงเริ่มต้นของการใช้งาน พนักงานอาจประสบความไม่สะดวกขณะปรับตัวเข้ากับกระบวนการและเทคโนโลยีใหม่ เพื่อให้แน่ใจว่าการผสานการทำงานเป็นไปอย่างราบรื่นและหยุดชะงักน้อยที่สุด องค์กรของคุณควรมุ่งเน้นไปที่การวางแผนอย่างรอบคอบ การทำงานร่วมกันของผู้มีส่วนได้ส่วนเสีย และการจัดการข้อกังวลของผู้ใช้

AWS รองรับข้อกำหนดความต้องการในการปกปิดข้อมูลของคุณได้อย่างไร

มีหลายข้อเสนอของ Amazon Web Services (AWS) ที่มีความสามารถในการปกปิดข้อมูลในตัว ดังตัวอย่างต่อไปนี้

  • Amazon Transcribe แปลงคำพูดเป็นข้อความโดยอัตโนมัติและสามารถปกปิดข้อมูลที่สำคัญตามที่ร้องขอ
  • Amazon Redshift จะใช้ SQL เพื่อวิเคราะห์ข้อมูลที่มีโครงสร้างและกึ่งโครงสร้างในคลังข้อมูล ฐานข้อมูลการดำเนินงาน และ Data Lake สนับสนุนการควบคุมการเข้าถึงตามบทบาท การรักษาความปลอดภัยระดับแถว การรักษาความปลอดภัยระดับคอลัมน์และเทคนิคการปกปิดข้อมูลแบบไดนามิก
  • Amazon Simple Notification Service (Amazon SNS) เป็นบริการแจ้งเตือน คุณสามารถใช้สิ่งนี้เพื่อกำหนดนโยบายการปกป้องข้อมูลที่สามารถค้นพบ ปกปิด และปกป้องข้อมูลที่ละเอียดอ่อนในการส่งข้อมูล

นอกจากนี้เรายังมีคู่มือการใช้งานที่มีอยู่เดิมว่าด้วยข้อกำหนดการปกปิดข้อมูลที่ซับซ้อน ยกตัวอย่างเช่น การปดปิดข้อมูลด้านสุขภาพที่ขับเคลื่อนด้วย AI ช่วยให้องค์กรด้านการดูแลสุขภาพระบุและปกปิดข้อมูลสุขภาพในภาพหรือข้อความได้ คำแนะนำนี้ใช้บริการต่อไปนี้:

นอกจากนี้คุณยังอาจพิจารณาเลือกจากหนึ่งในหลาย โซลูชั่นการปกปิดข้อมูลที่มีอยู่เดิมใน AWS Marketplace ได้ 

เริ่มต้นใช้งานการปกปิดข้อมูลบน AWS โดยการสร้างบัญชีวันนี้

ขั้นตอนถัดไปของ AWS

ลงชื่อสมัครใช้บัญชีฟรี

รับสิทธิ์การเข้าถึง AWS Free Tier ได้ทันที

ลงชื่อสมัครใช้งาน 
เริ่มต้นการสร้างในคอนโซล

เริ่มต้นสร้างในคอนโซลการจัดการของ AWS

ลงชื่อเข้าใช้