Amazon Web Services 한국 블로그

Amazon Macie 신규 출시 – 기계 학습 기반 자동 콘텐츠 검색, 분류 및 보안 설정 서비스

Amazon Macie는 Amazon S3에 저장된 데이터를 기계 학습 기반으로 자동으로 검색하고 분류 할 수 있는  서비스입니다. 데이터가 Macie에 의해 분류되면, 각 데이터 항목에 비즈니스 가치를 할당 한 다음 데이터를 지속적으로 모니터링하여 접근 패턴을 기반으로 의심스러운 활동을 탐지합니다. 이를 통해 서비스명의 뜻 그대로 여러분의 안전한 무기(Weapon)이 될 수 있습니다.

Macie 서비스의 주요 기능은 다음과 같습니다.

  • 데이터 보안 자동화 : 데이터를 분석, 분류 및 처리하여 기록 패턴, 데이터에 대한 사용자 인증, 데이터 접근 위치 및 시간을 파악
  • 데이터 보안 및 모니터링 : CloudWatch Events 및 Lambda를 통해보고 된 문제의 자동 해결과 함께 탐지 된 예외에 대한 사용 로그 데이터를 적극적으로 모니터링
  • 사전 손실 방지를 위한 데이터 가시성 : 스토리지 데이터의 세부 사항에 대한 관리 가시성을 제공하는 동시에 매뉴얼 방식 없는 즉시 보호 기능 제공
  • 데이터 연구 및 리포트 : 데이터 리포트 및 경고 관리 요구 사항에 대한 관리 구성 허용

Macie는 자연어 처리 (NLP)를 위한 기계 학습 알고리즘을 사용하여  S3 버킷의 데이터 분류를 자동화 할 수 있습니다. 또한, Macie의 예측 분석 알고리즘을 활용하여 데이터 접근 패턴을 동적으로 분석 할 수 있습니다. 모델 학습은 가능한 정보를 알려주고 가능한 의심스러운 행동에 대해 알려주는 데 사용됩니다. Macie는 또한 개인 식별 정보 (PII) 또는 민감한 개인 정보 (SP)의 일반적인 출처를 탐지하기 위해 특별히 엔진을 실행합니다. Macie는 AWS CloudTrail을 활용하고 S3 버킷의 PUT 요청에 대한 Cloudtrail 이벤트를 지속적으로 확인하고, 새로운 개체를 거의 실시간으로 자동 분류합니다.

Macie는 AWS 클라우드 보안 및 데이터 보호를 위한 강력한 도구이면서, 자원 관리, 표준 규정 준수 요구 사항 및 감사 표준을 지원할 수도 있습니다. 2018년 5월 25일 시행 될 수 있는 EU의 GDPR (General Protection Data Regulation)은 가장 엄격한 개인 정보 보호 규정입니다. Amazon Macie는 개인 식별 정보 (PII)를 확인하고, 고객에게 대시 보드를 제공합니다 이를 통해 고객이 데이터 암호화 및 익명화에 관한 GDPR 규정을 준수 할 수 있습니다. AWS Lambda와 결합하면 Macie는 GDPR 문제를 해결하는 데 도움이 되는 강력한 도구가 됩니다.

Amazon Macie 살펴 보기
이제 서비스를 잠깐 돌아 보겠습니다. 먼저 Macie 콘솔에서 Get Started을 클릭하여 데이터 분류 및 보호를 시작합니다.

아래에서 보시다시피 Amazon Macie 서비스를 사용하려면 서비스에 적합한 IAM 역할을 만들어야 하며 AWS CloudTrail을 활성화해야 합니다. (오늘 부터 AWS CloudTrail은 모든 고객이 자동으로 활성화 되었습니다.)

Macie를 쉽게 설정할 수 있도록 Macie User Guide에서 제공되는 CloudFormation 용 샘플 템플릿을 활용하여 필요한 IAM 역할 및 정책을 설정하면, 사용자가 직접 IAM 역할 및 정책을 설정하기 만하면 됩니다. (CloudTrail 시작하기 문서 참고)

AWS 계정이 여러 가지인 경우, Macie 서비스를 사용하는 마스터 계정과 다른 계정은 Macie 서비스와 통합 할 수 있습니다. 회원 계정의 사용자는 Macie 콘솔에 접근하기 위해 IAM 역할을 사용하여 마스터 계정에 대한 접근을 허가 받아야 합니다.

이제 IAM 역할이 만들어지고 CloudTrail이 활성화되었으므로 Enable Macie 버튼을 클릭하여 Macie의 데이터 모니터링 및 보호를 시작합니다.


여러분 계정에서 Macie가 서비스를 시작하면, 서비스 메인 화면이 나타나고 계정의 기존 알림이 표시됩니다. 방금 서비스 이용을 시작했기 때문에 현재 현재 현재 알림이 없습니다.

Macie 서비스를 사용해 보기 위해, S3 버킷 중 일부는 Macie와 연결해 보겠습니다. 그러나, 이미 AWS CloudTrail Management API를 사용하여 정보를 분석하고 처리하고 있기 때문에, Macie가 모니터링을 시작할 S3 버킷을 지정할 필요가 없습니다. 여기서는 CloudTrail의 특정 버킷에서 개체 수준의 API 이벤트를 모니터링 해 보겠습니다.

Amazon S3와 통합하기 위해 Macie 콘솔의 Integrations 탭으로 이동합니다. Integrations 탭에서 AccountsServices라는 두 가지 옵션이 표시됩니다. 계정 옵션은 회원 계정을 Macie와 통합하고 데이터 보존 정책을 설정하는 데 사용됩니다. 특정 S3 버킷을 Macie와 통합하려는 경우, Services 옵션을 클릭하고 Services 탭으로 이동합니다.


이제 Macie를 S3 서비스와 통합하면, S3 데이터 이벤트에 대한 로그를 저장하기 위한 Cloudtrails과 S3 버킷이 생성됩니다. 이제 계정 선택드롭 다운을 사용하여, Select an account 합니다. 여러분 계정을 선택하면 통합에 사용할 수 있는 서비스가 표시됩니다. Add 버튼을 클릭하여 Amazon S3 서비스를 선택하겠습니다.

이제 Macie가 분석 할 버킷을 선택할 수 있습니다. Review and Save 버튼을 선택하면 Save 버튼을 클릭하여 객체 수준 로깅을 확인하는 화면으로 이동합니다.

다음으로 Macie 데이터 분류를 맞춤 설정할 수 있는 방법을 살펴 보겠습니다.

앞에서 설명 드린 대로 Macie는 데이터를 자동으로 모니터링하고 분류합니다. Macie가 데이터를 식별하면, 데이터 개체를 파일 및 콘텐츠 유형 별로 분류합니다. Macie는 SVM (Support Vector Machine) 분류를 사용하여, 파일의 메타 데이터 외에도 S3 객체 내의 내용을 분류합니다.  딥러닝/기계 학습 분야에서 SVM은 데이터 분류 및 회귀 분석에 사용되는 학습 알고리즘이 있는 학습 모델입니다. Macie는 작성할 수 있는 소스 코드를 포함하여 데이터 콘텐츠의 정확한 탐지를 지원하기 위해 최적화 된 다양한 콘텐츠 유형의 데이터를 사용하여 SVM 분류를 학습합니다.

Macie는 데이터 개체 또는 파일 당 하나의 콘텐츠 형식만 할당하지만, 이러한 개체를 분류하는 Macie 서비스에서  콘텐츠 형식 및 파일 확장명을 사용하거나 사용하지 않도록 설정할 수 있습니다. Macie가 데이터를 분류하면, 개체의 위험 수준을 1에서 10 사이의 값으로 지정합니다. 위험도가 가장 높은 위험도는 10이며 가장 낮은 위험도는 1입니다.

Macie에서 데이터 분류를 맞춤 설정하려면 Settings 탭으로 이동합니다. 이제 Macie 분류 설정을 활성화 또는 비활성화 할 수 있는 선택 항목이 표시됩니다.


예를 들어, Macie의 File extension을 선택합니다.  Macie가 분류를 위해 추적하고 사용하는 파일 확장자 목록이 제시됩니다.

테스트로 Android 애플리케이션 설치 파일의 apk 파일 확장명을 편집하고, 드롭 다운에서 No – disabled를 선택하고 Save 버튼을 클릭하면, 파일의 모니터링을 비활성화합니다. 물론, 나중에 안드로이드 개발 바이너리를 포함하여 데이터 파일의 전체 컬렉션을 안전하게 유지하고자 할 때, 이 기능을 다시 사용하도록 설정할 수 있습니다.

마지막 한가지는 Macie를 통한 데이터 분류는 개인 혹은 비즈니스와 표준 규정 등 중요한 정보를 취급하기 위해 저장된 데이터와 자원을 쉽게 분류하여 가시성을 제공합니다.

이제 Macie를 통해 분류하고 모니터하는 데이터를 탐험을 시작하면, 마지막에는 Macie 서비스 콘솔 대시 보드를 살펴 보게 됩니다.

Macie 대시 보드는 Macie가 여러분의 데이터를 모니터하고 분류함에 따라 수집 된 모든 데이터와 활동에 대한 완벽한 시각화를 제공합니다. 대시 보드에는 범주별로 그룹화 된 측정 항목 및 보기가 표시되어 데이터에 대한 다양한 시각적 시각을 제공합니다. 대시 보드 화면에서 통계 관점으로 직접 Research 탭으로 이동하여 통계치를 기반으로 쿼리를 작성하고 실행할 수 있습니다. 이 쿼리는 가능한 보안 문제 또는 문제에 대한 알림을 위해, 사용자 지정된 경고를 설정하는 데 사용할 수 있습니다. ResearchAlerts 탭을 둘러 볼 기회는 없었지만, Macie 사용자 가이드에서 이러한 기능에 대한 자세한 정보를 확인할 수 있습니다.

대시 보드로 되돌아 가면, Macie 대시 보드에는 투어 중 생중계, 통계 및 기능 등 많은 리소스가 있으므로, 이들 기능의 개요를 알려 드리겠습니다.

Dashboard 통계치는 아래와 같습니다.

  • 고위험 S3 개체 – 10까지 8의 경우, 위험 수준 데이터 객체
  • 총 이벤트 발생 – Macie 이후의 모든 이벤트 발생의 총량
  • 총 사용자 세션 – 데이터 CloudTrail의 5 분 스냅 샷

Dashboard Views – 모니터링 데이터 및 활동의 다양한 항목을 표시

  • S3 objects for a selected time range
  • S3 objects
  • S3 objects by personally identifiable information (PII)
  • S3 objects by ACL
  • CloudTrail events and associated users
  • CloudTrail errors and associated users
  • Activity location
  • AWS CLoudTrail events
  • Activity ISPs
  • AWS CloudTrail user identity types

요약

지금까지 Amazon Macie 서비스에 대해 간략히 알아보았습니다. Macie는 S3에 저장된 데이터를 보호하는 데, 기계 학습 및 딥러닝을 활용한 신규 데이터 보안 서비스입니다.  Macie에 자연 언어 처리 (NLP)를 사용하면, 쉽게 단순히 서비스를 사용하여 높은 정확도 분류 및 즉각적인 데이터 보호를 시작 할 수 있습니다. 대화형 대시 보드는  데이터, 데이터 접근 및 API 호출의 거대한 흐름을 분석 할 수 있는 가시성을 제공합니다.

더 자세한 것은 제품 페이지 또는 사용 설명 문서를 참고 하시기 바랍니다.

Tara

이 글은 Launch – Hello Amazon Macie: Automatically Discover, Classify, and Secure Content at Scale 의 한국어 편집본입니다.