- การประมวลผลบนคลาวด์คืออะไร
- ฮับแนวคิดการประมวลผลบนคลาวด์
- ความปลอดภัย การระบุตัวตน และการปฏิบัติตามข้อกำหนด
การปกปิดข้อมูลคืออะไร
การปกปิดข้อมูลคืออะไร
การปกปิดข้อมูลเป็นกระบวนการซ่อนข้อมูลโดยการแก้ไขตัวอักษรและตัวเลขเดิม เนื่องจากข้อกำหนดด้านกฎระเบียบและความเป็นส่วนตัว องค์กรต้องปกป้องข้อมูลที่ละเอียดอ่อนที่รวบรวมเกี่ยวกับลูกค้าและการดำเนินงานของตน การปกปิดข้อมูลจะสร้างข้อมูลปลอมขององค์กรโดยเปลี่ยนข้อมูลที่เป็นความลับ มีการใช้เทคนิคต่างๆ เพื่อสร้างการเปลี่ยนแปลงที่เหมือนจริงและมีโครงสร้างคล้ายคลึงกัน เมื่อข้อมูลถูกปกปิดแล้ว คุณจะไม่สามารถย้อนกลับหรือติดตามค่าข้อมูลเดิมโดยไม่ต้องเข้าถึงชุดข้อมูลเดิม
กรณีการใช้งานของการปกปิดข้อมูลมีอะไรบ้าง
เทคนิคการปกปิดข้อมูลสนับสนุนความพยายามขององค์กรในการปฏิบัติตามข้อบังคับด้านความเป็นส่วนตัวของข้อมูล เช่น ระเบียบการคุ้มครองข้อมูลทั่วไป (GDPR) คุณสามารถปกป้องข้อมูลได้หลายประเภท เช่น ข้อมูลที่ระบุตัวตนของบุคคลได้ (PII) ข้อมูลทางการเงิน ข้อมูลสุขภาพที่ได้รับการคุ้มครอง (PHI) และทรัพย์สินทางปัญญา
ต่อไป เราจะสำรวจกรณีการใช้งานการปกปิดข้อมูลบางส่วน
การพัฒนาที่ปลอดภัย
การพัฒนาซอฟต์แวร์และสภาพแวดล้อมการทดสอบจำเป็นต้องมีชุดข้อมูลจริงเพื่อวัตถุประสงค์ในการทดสอบ อย่างไรก็ตาม การใช้ข้อมูลจริงทำให้เกิดความกังวลด้านความปลอดภัย การปิดบังข้อมูลช่วยให้นักพัฒนาและผู้ทดสอบสามารถทำงานกับข้อมูลการทดสอบที่เหมือนจริงซึ่งคล้ายกับต้นฉบับ แต่ไม่มีการเปิดเผยข้อมูลที่ละเอียดอ่อน ช่วยลดความเสี่ยงด้านความปลอดภัยในรอบการพัฒนาและการทดสอบ
การวิเคราะห์และการวิจัย
การปกปิดข้อมูลช่วยให้นักวิทยาศาสตร์ข้อมูลและนักวิเคราะห์สามารถทำงานกับชุดข้อมูลขนาดใหญ่ได้โดยไม่กระทบต่อความเป็นส่วนตัวของแต่ละคน นักวิจัยได้รับข้อมูลเชิงลึกและแนวโน้มอันมีค่าจากข้อมูลและรับรองการปกป้องความเป็นส่วนตัว ตัวอย่างเช่น นักวิทยาศาสตร์สามารถใช้ชุดข้อมูลที่ไม่ระบุตัวตนเพื่อศึกษาประสิทธิผลของยาตัวใหม่ วิเคราะห์ผลการรักษา หรือตรวจสอบผลข้างเคียงที่อาจเกิดขึ้น
การทำงานร่วมกันภายนอก
องค์กรมักจะต้องแชร์ข้อมูลกับคู่ค้า ผู้ขาย หรือที่ปรึกษาภายนอก ด้วยการปกปิดฟิลด์หรือแอตทริบิวต์บางอย่าง องค์กรสามารถทำงานร่วมกับบุคคลภายนอกและยังคงปกป้องข้อมูลที่ละเอียดอ่อนได้
การฝึกอบรมพนักงาน
คุณสามารถใช้การปกปิดข้อมูลสำหรับเซสชันการฝึกอบรมพนักงานหรือการสาธิตซอฟต์แวร์ ด้วยการปกปิดข้อมูลที่ละเอียดอ่อน องค์กรสามารถให้ตัวอย่างที่เหมือนจริงโดยไม่ต้องเปิดเผยข้อมูลลูกค้าหรือธุรกิจที่แท้จริง พนักงานสามารถเรียนรู้และฝึกฝนทักษะโดยไม่จำเป็นต้องเข้าถึงข้อมูลที่ไม่ได้รับอนุญาต
การปกปิดข้อมูลมีกี่ประเภท
ต่อไป เราจะให้ประเภทการปิดบังข้อมูลทั่วไปบางประเภท
การปกปิดข้อมูลแบบคงที่
การปิดบังข้อมูลแบบคงที่เป็นกระบวนการของการใช้ชุดกฎการปิดบังแบบตายตัวกับข้อมูลที่ละเอียดอ่อนก่อนที่จะจัดเก็บหรือแชร์ โดยทั่วไปจะใช้กับข้อมูลที่ไม่เปลี่ยนแปลงบ่อยหรือคงที่เมื่อเวลาผ่านไป คุณกำหนดกฎล่วงหน้าและนำไปใช้กับข้อมูลอย่างสม่ำเสมอ ซึ่งทำให้แน่ใจได้ว่ามีการมาสก์ที่สอดคล้องกันในสภาพแวดล้อมต่างๆ
แม้ว่ารายละเอียดจะซับซ้อน แต่นี่คือภาพรวมของกระบวนการปิดบังข้อมูลแบบคงที่:
- ระบุและทำความเข้าใจข้อมูลที่ละเอียดอ่อน
- ออกแบบและพัฒนากฎการปกปิด
- เลือกอัลกอริทึมการปกปิดข้อมูลที่เหมาะสม
- ใช้กฎการปกปิดกับข้อมูลจริง
จากนั้นคุณสามารถแบ่งปันข้อมูลที่ปกปิดได้ตามต้องการ
การปกปิดข้อมูลแบบไดนามิก
การปิดบังข้อมูลแบบไดนามิกใช้เทคนิคการปิดบังแบบเรียลไทม์ โดยจะปรับเปลี่ยนข้อมูลที่ละเอียดอ่อนที่มีอยู่แบบไดนามิกเมื่อผู้ใช้เข้าถึงหรือสอบถาม ส่วนใหญ่จะใช้สำหรับการรักษาความปลอดภัยข้อมูลตามบทบาทในแอปพลิเคชัน เช่น การสนับสนุนลูกค้าหรือการจัดการเวชระเบียน
การปกปิดข้อมูลแบบไดนามิกทำงานดังนี้:
- ผู้ใช้ทั้งหมดสื่อสารกับฐานข้อมูลผ่านพร็อกซีเซิร์ฟเวอร์
- เมื่อผู้ใช้ขออ่านข้อมูล พร็อกซีฐานข้อมูลจะใช้กฎการปิดบังตามบทบาทผู้ใช้ สิทธิ์ หรือสิทธิ์การเข้าถึง
- ผู้ใช้ที่ได้รับอนุญาตจะได้รับข้อมูลต้นฉบับ ในขณะที่ผู้ใช้ที่ไม่ได้รับอนุญาตจะได้รับข้อมูลที่ปกปิดไว้
แม้ว่ากระบวนการนี้ไม่จำเป็นต้องมีการเตรียมการล่วงหน้า แต่อาจส่งผลกระทบต่อประสิทธิภาพการทำงาน
การปกปิดข้อมูลที่กำหนดไว้
การปกปิดข้อมูลที่กำหนดไว้ช่วยให้มั่นใจได้ว่าค่าอินพุตเดียวกันจะถูกปิดบังให้เป็นค่าเอาต์พุตเดียวกันอย่างสม่ำเสมอ ตัวอย่างเช่น หากชื่อใดชื่อหนึ่งถูกปกปิดด้วยคำว่า "John" ในหนึ่งรายการ ชื่อนั้นจะถูกสวมหน้ากากเป็น "John" ตลอดทั้งระบบ
เทคนิคการปกปิดแบบกำหนดไว้มักจะเกี่ยวข้องกับการแทนที่ข้อมูลหรือโทเค็น โดยที่การแม็ปที่สอดคล้องกันจะยังคงอยู่ระหว่างคอลัมน์ข้อมูลดั้งเดิมและค่าที่ปิดบัง
การปกปิดข้อมูลขณะใช้งาน
การปิดบังข้อมูลขณะใช้งานจะปกปิดข้อมูลที่ละเอียดอ่อนในหน่วยความจำ ดังนั้นจึงไม่มีข้อกำหนดในการจัดเก็บข้อมูลที่แก้ไขในฐานข้อมูล ซึ่งมีประโยชน์ในไปป์ไลน์การปรับใช้อย่างต่อเนื่องหรือในสถานการณ์การรวมระบบที่ซับซ้อน ซึ่งข้อมูลมักเคลื่อนย้ายระหว่างสภาพแวดล้อมการผลิตและสภาพแวดล้อมที่ไม่ใช่การผลิต ในขั้นตอนที่จำเป็นในไปป์ไลน์ แอปพลิเคชันจะปิดบังข้อมูล จากนั้นส่งต่อไปยังขั้นตอนถัดไปในไปป์ไลน์
การทำให้ข้อมูลยุ่งเหยิงทางสถิติ
การทำให้ข้อมูลยุ่งเหยิงทางสถิติเกี่ยวข้องกับการเปลี่ยนแปลงค่าของข้อมูลที่ละเอียดอ่อนในลักษณะที่รักษาคุณสมบัติทางสถิติและความสัมพันธ์ภายในข้อมูล ช่วยให้มั่นใจได้ว่าข้อมูลที่ปกปิดไว้จะรักษาการกระจาย รูปแบบ และความสัมพันธ์โดยรวมของข้อมูลต้นฉบับเพื่อการวิเคราะห์ทางสถิติที่แม่นยำ เทคนิคการทำให้ข้อมูลยุ่งเหยิงทางสถิติมีการใช้ฟังก์ชันทางคณิตศาสตร์หรืออัลกอริธึมการก่อกวนกับข้อมูล
เทคนิคการปกปิดข้อมูลทั่วไปมีอะไรบ้าง
มีอัลกอริธึมหลายอย่างที่คุณสามารถใช้เพื่อการปกป้องข้อมูล ต่อไปนี้เป็นวิธีการปกปิดข้อมูลทั่วไป
การสุ่ม
ด้วยการสุ่ม คุณแทนที่ข้อมูลที่ละเอียดอ่อนด้วยค่าที่สร้างแบบสุ่มที่ไม่มีความสัมพันธ์กับข้อมูลต้นฉบับ ตัวอย่างเช่น คุณสามารถแทนที่ชื่อ ที่อยู่ หรือข้อมูลส่วนบุคคลอื่นๆ ได้ด้วยค่าสมมติหรือค่าที่เลือกแบบสุ่ม
การทดแทน
การปกปิดด้วยการแทนที่เกี่ยวข้องกับการแทนที่ข้อมูลที่ละเอียดอ่อนด้วยข้อมูลที่คล้ายกันแต่เป็นข้อมูลสมมติ ตัวอย่างเช่น คุณสามารถแทนที่ชื่อจริงด้วยชื่อจากรายการที่กำหนดไว้ล่วงหน้า คุณยังสามารถใช้อัลกอริทึมเพื่อสร้างหมายเลขบัตรเครดิตที่คล้ายกันแต่เป็นของปลอมได้
สับเปลี่ยน
ด้วยการสับเปลี่ยน คุณจะจัดลำดับค่าใหม่ภายในชุดข้อมูลเพื่อรักษาคุณสมบัติทางสถิติและทำให้แต่ละระเบียนไม่สามารถระบุตัวตนได้ เทคนิคนี้มักใช้เพื่อรักษาความสัมพันธ์ภายในข้อมูล
ตัวอย่างเช่น ในตารางข้อมูล คุณสามารถสุ่มสุ่มข้อมูลคอลัมน์เพื่อให้ค่าแถวเปลี่ยนแปลงได้ ในทางปฏิบัติ คุณสามารถรักษาความสัมพันธ์ระหว่างลูกค้ากับการทำธุรกรรมของพวกเขาในขณะที่เปลี่ยนชื่อและรายละเอียดการติดต่อได้
การเข้ารหัส
ด้วยการปิดบังด้วยการเข้ารหัส คุณจะเข้ารหัสข้อมูลที่ละเอียดอ่อนโดยใช้อัลกอริทึมการเข้ารหัส คุณแปลงข้อมูลเป็นรูปแบบที่อ่านไม่ได้ และเฉพาะผู้ใช้ที่ได้รับอนุญาตซึ่งมีคีย์ถอดรหัสเท่านั้นที่สามารถเข้าถึงข้อมูลต้นฉบับได้ เทคนิคนี้ให้ระดับความปลอดภัยของข้อมูลที่สูงขึ้น แต่จะส่งผลต่อประสิทธิภาพการสืบค้นเนื่องจากจำเป็นต้องมีการถอดรหัสสำหรับการวิเคราะห์ข้อมูล
การแฮช
การแฮชเป็นเทคนิคการแปลงที่แปลงข้อมูลเป็นสตริงอักขระที่มีความยาวคงที่ โดยทั่วไปจะใช้เพื่อปกปิดรหัสผ่านหรือข้อมูลที่ละเอียดอ่อนอื่นๆ ซึ่งไม่จำเป็นต้องใช้ค่าดั้งเดิม และคุณเพียงแค่ต้องยืนยันข้อมูลเท่านั้น
การสร้างโทเค็น
ด้วยการสร้างโทเค็น คุณจะแทนที่ข้อมูลการผลิตด้วยโทเค็นหรือค่าอ้างอิงที่สร้างขึ้นแบบสุ่ม คุณจัดเก็บข้อมูลต้นฉบับไว้ในตำแหน่งที่ปลอดภัยแยกต่างหาก และใช้โทเค็นแทนระหว่างการประมวลผลหรือการวิเคราะห์ โทเค็นช่วยรักษาความสมบูรณ์ของข้อมูลในขณะที่ลดความเสี่ยงในการเปิดเผยข้อมูลที่ละเอียดอ่อน
การเว้นว่าง
การเว้นว่าง (หรือการเว้น) เป็นโซลูชันการปกปิดข้อมูลที่แทนที่ข้อมูลที่ละเอียดอ่อนด้วยค่า Null หรือช่องว่าง สิ่งนี้จะลบข้อมูลออกจากชุดข้อมูลอย่างมีประสิทธิภาพ วิธีการนี้เหมาะสมเมื่อคุณต้องการคงรูปแบบหรือโครงสร้างของข้อมูลไว้ แต่ข้อมูลเฉพาะต้องถูกปกปิด
อะไรคือความท้าทายในการปกปิดข้อมูล
ต่อไป เราจะพูดถึงความท้าทายทั่วไปบางประการในการปิดบังข้อมูล
การเก็บรักษาแอตทริบิวต์
เป็นสิ่งสำคัญสำหรับการวิจัยและการวิเคราะห์ว่าการปิดบังข้อมูลจะรักษาแอตทริบิวต์ข้อมูลดั้งเดิมสำหรับข้อมูลบางประเภท คุณต้องการให้แน่ใจว่าเครื่องมือปิดบังข้อมูลของคุณรักษาประเภทข้อมูลดั้งเดิมหรือรักษาความถี่ของประเภทข้อมูลที่เกี่ยวข้อง
ตัวอย่างเช่น หากเครื่องมือเปลี่ยนแปลงการแสดงข้อมูลประชากรของข้อมูลลูกค้าหรือสถิติหมวดหมู่บัตรเมื่อสร้างความสับสนให้กับรายละเอียดบัตรเครดิต สิ่งนี้อาจส่งผลกระทบต่อการวิเคราะห์ การเก็บรักษาแอตทริบิวต์จะกลายเป็นสิ่งที่ท้าทายในกระบวนการปกปิดข้อมูลบางอย่างเช่นการสุ่มหรือสร้างโทเค็น
ความสมบูรณ์เชิงความหมาย
ค่าปลอมที่สร้างขึ้นต้องเป็นไปตามกฎทางธุรกิจและข้อจำกัดที่เกี่ยวข้องกับข้อมูลประเภทต่างๆ ตัวอย่างเช่น เงินเดือนควรอยู่ในช่วงที่กำหนด และหมายเลขประจำตัวประชาชนควรเป็นไปตามรูปแบบที่กำหนดไว้ล่วงหน้า การรักษาความสมบูรณ์ของความหมายเป็นเรื่องท้าทาย แต่ต้องทำให้แน่ใจว่าข้อมูลที่ปกปิดยังคงมีความหมายและเป็นจริง
เอกลักษณ์ของข้อมูล
ในกรณีที่ข้อมูลต้นฉบับต้องการความซ้ำกัน เช่น หมายเลขรหัสพนักงาน เทคนิคการปกปิดข้อมูลจะต้องระบุค่าที่ไม่ซ้ำเพื่อแทนที่ข้อมูลเดิม การไม่มีเอกลักษณ์ในฟิลด์สำคัญอาจสร้างความขัดแย้งหรือไม่สอดคล้องกัน
การผสานรวมกับเวิร์กโฟลว์ที่มีอยู่
การผสมผสานการปกปิดข้อมูลเข้ากับเวิร์กโฟลว์ที่มีอยู่อาจเป็นเรื่องยาก โดยเฉพาะอย่างยิ่งในช่วงเริ่มต้นของการใช้งาน พนักงานอาจประสบความไม่สะดวกขณะปรับตัวเข้ากับกระบวนการและเทคโนโลยีใหม่ เพื่อให้แน่ใจว่าการผสานการทำงานเป็นไปอย่างราบรื่นและหยุดชะงักน้อยที่สุด องค์กรของคุณควรมุ่งเน้นไปที่การวางแผนอย่างรอบคอบ การทำงานร่วมกันของผู้มีส่วนได้ส่วนเสีย และการจัดการข้อกังวลของผู้ใช้
AWS รองรับข้อกำหนดความต้องการในการปกปิดข้อมูลของคุณได้อย่างไร
มีหลายข้อเสนอของ Amazon Web Services (AWS) ที่มีความสามารถในการปกปิดข้อมูลในตัว ดังตัวอย่างต่อไปนี้
- Amazon Transcribe แปลง คำพูดเป็นข้อความโดยอัตโนมัติและสามารถปกปิดข้อมูลที่ละเอียดอ่อนตามที่ร้องขอ
- Amazon Redshift ใช้ SQL เพื่อวิเคราะห์ข้อมูลที่มีโครงสร้างและกึ่งโครงสร้างทั่วคลังข้อมูล ฐานข้อมูลการดำเนินงาน และทะเลสาบข้อมูล สนับสนุนการควบคุมการเข้าถึงตามบทบาท การรักษาความปลอดภัยระดับแถว การรักษาความปลอดภัยระดับคอลัมน์และเทคนิคการปกปิดข้อมูลแบบไดนามิก
- Amazon Simple Notification Service (Amazon SNS) เป็นบริการแจ้งเตือน คุณสามารถใช้สิ่งนี้เพื่อกำหนดนโยบายการปกป้องข้อมูลที่สามารถค้นพบ ปกปิด และปกป้องข้อมูลที่ละเอียดอ่อนในการส่งข้อมูล
นอกจากนี้เรายังมีคู่มือการใช้งานที่มีอยู่เดิมว่าด้วยข้อกำหนดการปกปิดข้อมูลที่ซับซ้อน ตัวอย่างเช่น คำแนะนำการปิด บังข้อมูลสุขภาพที่ขับเคลื่อนด้วย AI ช่วยให้องค์กร ด้านการดูแลสุขภาพระบุและปกปิดข้อมูลสุขภาพในรูปภาพหรือข้อความ คำแนะนำนี้ใช้บริการต่อไปนี้:
- Amazon Comprehend Medical ตรวจจับข้อมูลสุขภาพในเนื้อหาของข้อความ
- Amazon Rekognition ระบุ ข้อความในภาพ
- Amazon API Gateway และ AWS Lambda ให้อินเทอร์เฟซ API สำหรับฟังก์ชันนี้
- AWS Identity and Access Management (IAM) อนุญาตให้คำ ขอ API
คุณอาจพิจารณาเลือกจากหนึ่งใน โซลูชันการปิดบังข้อมูลที่ทำไว้ล่วงหน้าในตลาด AWS
เริ่มต้นด้วยการปิดบังข้อมูลบน AWS โดยการ สร้างบัญชีวัน นี้
ขั้นตอนถัดไปของ AWS
Browse all cloud computing concepts
Browse all cloud computing concepts content here:
Did you find what you were looking for today?
Let us know so we can improve the quality of the content on our pages