구현 안내서 시작하기

6단계  |  30분

Machine_Learning_HERO-ART_SM

Q: Amazon Machine Learning(Amazon ML)이란 무엇입니까?

Amazon ML은 부정 탐지, 수요 예측, 클릭 예측을 비롯한 예측 애플리케이션을 쉽게 구축하는 데 사용할 수 있는 서비스입니다. Amazon ML은 강력한 알고리즘을 사용하여 기존 데이터에서 패턴을 찾아내고, 신규 데이터가 제공될 때 이러한 패턴을 통해 신규 데이터로부터 예측을 생성하는 기계 학습 모델을 만들 수 있습니다. AWS Management Console과 API는 애플리케이션 요구 사항에 맞추어 기계 학습 모델을 생성하고, 생성된 모델의 품질을 측정하고, 예측을 미세 조정하는 프로세스를 지원하는 마법사와 데이터 및 모델 시각화 도구를 제공합니다. 모델이 생성되면, 사용자 지정 예측 생성 코드를 구현하거나 인프라도 관리할 필요 없이 간단한 API를 사용하여 애플리케이션에 대한 예측을 생성할 수 있습니다. Amazon ML은 확장성이 뛰어나고, 수십억 개의 예측을 생성할 수 있으며, 이러한 예측을 높은 처리량과 함께 실시간으로 제공합니다. Amazon ML은 설치 비용이 없고 사용량에 따라 비용을 지불하므로, 작게 시작하여 애플리케이션이 성장함에 따라 확장할 수 있습니다.

Q: Amazon ML의 사용 사례에는 어떤 것이 있습니까?

Amazon ML은 다양한 예측 애플리케이션을 생성하는 데 사용할 수 있습니다. 예를 들어 Amazon ML을 사용하면 의심스러운 거래 표시, 부정 거래 탐지, 수요 예측, 콘텐츠 개인화, 사용자 행동 예측, 리뷰 필터링, 소셜 미디어 확인, 자유 형식의 텍스트 분석, 항목 추천 등을 지원하는 애플리케이션을 구축할 수 있습니다.

Q: Amazon ML에는 어떤 보안 조치가 적용됩니까?

Amazon ML에서는 전송 중이거나 보관 중인 ML 모델 및 기타 시스템 아티팩트가 암호화됩니다. Amazon ML API 및 콘솔에 대한 요청은 안전한 SSL 연결을 통해 전달됩니다. AWS Identity and Access Management(IAM)를 사용하여 특정 Amazon Machine Learning 작업 및 리소스에 액세스할 수 있는 IAM 사용자를 제어할 수 있습니다.

Q: Amazon ML에서는 내 데이터를 어디에 저장할 수 있습니까?

Amazon ML을 사용하여 세 곳의 데이터 스토어에서 데이터를 읽을 수 있습니다. 즉, (a) 이 프로젝트 예제에서처럼 Amazon S3에서 하나 이상의 파일, (b) Amazon Redshift 쿼리의 결과 또는 (c) MySQL 엔진으로 실행 중인 데이터베이스에서 실행된 Amazon Relational Database Service(RDS) 쿼리의 결과를 읽을 수 있습니다. 다른 제품의 데이터는 보통 Amazon S3에 CSV 파일로 내보낼 수 있으므로 Amazon ML에서 액세스할 수 있습니다. Amazon ML이 세 곳의 데이터 스토어에 액세스할 수 있도록 권한을 구성하는 방법에 대한 세부 지침은 Amazon Machine Learning Developer Guide를 확인하십시오.

Q: 이 프로젝트 예제에 자체 데이터를 사용하고 싶습니다. 교육에 사용할 데이터 세트의 크기에 제한이 있습니까?

Amazon ML에서는 모델 교육에 최대 100GB까지 데이터 세트를 사용할 수 있습니다.

Q: 원하는 결과를 얻지 못하는 경우 모델을 어떻게 튜닝합니까?

모델 품질을 개선하는 가장 좋은 방법은 교육에 좀 더 좋은 품질의 데이터를 사용하는 것입니다. 더 많은 관찰 값을 추가하고, 정보 유형을 추가하고, 학습 프로세스를 최적화하기 위해 데이터를 변환하는 것은 모두 모델의 예측 정확성을 높이는 좋은 방법입니다. 또한, Amazon ML은 (a) 모델의 목표 크기, (b) 데이터 전송 수, (c) 모델에 적용할 규칙의 유형 및 수와 같이 학습 프로세스 튜닝을 위한 몇 가지 파라미터도 제공합니다. 마지막으로 고려해야 할 모델 튜닝의 중요한 측면은 ML 모델에서 생성한 예측을 기업 목표에 최적화되도록 애플리케이션에서 어떻게 해석하는가입니다. Amazon ML은 해석 한계 점수를 바이너리 분류 모델에 맞게 조정하도록 지원하여 교육된 모델에서 발생할 수 있는 여러 종류의 실수 사이에서 합리적으로 균형을 맞출 수 있습니다. 예를 들어, 일부 애플리케이션은 거짓 긍정 오류에 대해서는 허용 한계가 높지만 거짓 부정에 대해서는 엄격합니다. Amazon ML 서비스 콘솔을 사용하여 이러한 요구 사항에 맞게 한계 점수를 조정할 수 있습니다.

Q: Amazon ML을 사용하여 구축한 예측 모델로 무엇을 할 수 있습니까?

예측을 생성한 후에는 몇 가지 방법으로 결과를 활용할 수 있습니다. 예를 들어 데이터를 스프레드시트에 로드하여 예측 점수별로 데이터를 정렬 및 필터링할 수 있습니다. 또한, 데이터를 Amazon RDS 또는 Amazon RedShift와 같은 데이터베이스로 로드하여 정규화된 세그먼트 목록을 생성할 수 있습니다. 그 밖에도 Amazon DynamoDB를 통해 예측 점수를 NoSQL 데이터베이스로 로드하여 애플리케이션에 대한 예측 점수를 실시간으로 제공할 수 있습니다.

구현 안내서 시작하기