게시된 날짜: Jan 24, 2019
Amazon SageMaker 배치 변환에서는 이제 지원되는 SplitType으로 TFRecord 형식을 지원하여 데이터 세트가 TFRecord 경계로 분할되도록 합니다. 이는 RecordIO, CSV 및 Text와 같이 지원되는 형식의 목록에 추가됩니다.
Amazon SageMaker는 모든 개발자 및 데이터 과학자가 기계 학습 모델을 쉽고 빠르게 구축, 교육 및 배포할 수 있도록 지원하는 완전 관리형 서비스입니다. SageMaker의 중요 기능은 배치 데이터에 대해 예측을 실행할 수 있게 해주는 배치 변환입니다.
TFRecord는 표준 TensorFlow 데이터 형식입니다. 이는 대규모 데이터 세트를 효율적으로 저장 및 처리할 수 있게 해주는 레코드 중심 이진 파일 형식입니다. 이 향상된 기능을 통해 이제 일련의 이진 레코드를 간단히 저장할 수 있게 되었으며, 이는 SageMaker 배치 변환을 사용하여 대규모 데이터 세트 작업을 진행할 때 적합합니다. 배치 변환 작업을 실행할 때 TFRecord를 사용하기 위해 SplitType으로 TFRecord를 선택하기만 하면 데이터 세트가 TFRecord 경계로 분할됩니다. 또한 MultiRecord의 BatchStrategy를 지정하여 단일 요청의 여러 레코드를 배치로 묶을 수도 있습니다.
이제 현재 Amazon SageMaker를 사용할 수 있는 모든 AWS 리전에서 TFRecord가 지원됩니다. 자세히 알아보려면 설명서 및 샘플 예를 참조하십시오.