게시된 날짜: Jun 30, 2023
이제 Amazon SageMaker Canvas가 Apache Parquet 파일 형식을 지원함에 따라 테이블 형식, 시계열 예측 및 NLP 데이터 세트를 위한 추가 파일 형식을 사용할 수 있게 되었습니다. SageMaker Canvas는 기계 학습 경험이 없는 비즈니스 분석가도 코드를 작성할 필요 없이 정확한 ML 예측을 직접 생성할 수 있도록 도와주는 시각적 인터페이스입니다.
오늘부터 Canvas는 효율적인 데이터 스토리지 및 검색을 위해 설계된 오픈 소스 열 지향 데이터 파일 형식인 Apache Parquet을 지원합니다. 이 새로운 기능을 통해 테이블 형식, 시계열 예측 및 NLP 사용 사례에 대해 CSV 파일 외에도 Parquet 파일 형식을 사용하여 데이터를 가져올 수 있으므로 유연성이 더욱 높아집니다. Canvas에서 데이터 세트를 생성할 때 로컬 디스크나 Amazon S3 버킷에서 여러 Parquet 파일을 선택할 수 있습니다. 각 Parquet 파일의 크기는 최대 5GB까지 가능합니다. Parquet 파일은 효율적인 압축 및 인코딩 체계를 통해 Canvas에서 데이터 사용의 효율성을 극대화하여 데이터를 가져오고, ML 모델을 구축하고, 예측을 생성합니다.
Apache Parquet에 대한 지원은 현재 SageMaker Canvas가 제공되는 모든 AWS 리전에서 사용할 수 있습니다. 자세한 내용은 제품 설명서를 참조하세요.