게시된 날짜: May 1, 2023
Amazon SageMaker Data Wrangler는 기계 학습(ML)용 데이터를 집계하고 준비하는 시간을 몇 주에서 몇 분으로 단축합니다. SageMaker Data Wrangler를 사용하면 데이터 준비 및 특성 추출 프로세스를 간소화하고, 단일 시각적 인터페이스에서 데이터 선택, 탐색, 정리 및 처리를 비롯한 데이터 준비 워크플로의 각 단계를 완료할 수 있습니다.
오늘부터 Amazon SageMaker Data Wrangler의 새로운 기능을 사용하여 레이블 지정, 훈련 또는 추론을 위한 이미지 데이터를 준비할 수 있습니다. Amazon S3에서 이미지를 미리 보고 가져올 수 있으며 기본 제공되는 다양한 이미지 변환을 사용하여 이미지 데이터를 정리 및 표준화하고 품질을 개선할 수 있습니다. 크기 조정, 중복 삭제, 회전, 뒤집기, 그레이스케일, 대비 향상, 블러 및 노이즈 추가 등이 이러한 기본 제공 변환에 포함됩니다. 또한 Data Wrangler는 사용자 지정 코드 및 기본 제공 코드 스니펫을 사용하여 특이치를 탐지하거나 이미지에서 텍스트를 추출하는 것과 같은 고급 사용 사례를 지원합니다. 이러한 코드 스니펫에는 Amazon SageMaker JumpStart를 사용하여 사전 학습된 모델을 활용하여 사전 배포된 모델 엔드포인트를 호출하여 고급 분석 또는 변환을 수행하는 방법의 예가 포함되어 있습니다. 대화형 모드에서 샘플링된 이미지 데이터에 대한 레시피를 생성한 후 시각적 인터페이스를 통해 PySpark 작업을 생성하여 데이터 세트의 모든 이미지로 처리를 확장할 수 있습니다.
Data Wrangler는 현재 Data Wrangler가 제공되는 모든 리전에서 이미지 데이터 준비 기능을 지원합니다. 자세한 내용은 이 블로그 게시물과 AWS 기술 설명서를 참조하세요.