게시된 날짜: Dec 3, 2019
이제 Amazon Redshift 쿼리 결과를 분석을 위한 효율적인 개방형 열 기반 스토리지인 Apache Parquet으로 Amazon S3 데이터 레이크에 언로드할 수 있습니다. Parquet 형식은 텍스트 형식에 비해 언로드 속도가 최대 2배 빠르고 Amazon S3에서 스토리지 사용량이 최대 6배 적습니다. 따라서 Amazon Redshift에서 Amazon S3 데이터 레이크로 데이터 변환 및 보강 작업의 결과물을 오픈 형식으로 저장할 수 있습니다. 그리고 Redshift Spectrum과 Amazon Athena, Amazon EMR, Amazon SageMaker 등의 기타 AWS 서비스를 사용하여 데이터를 분석할 수 있습니다.
하나 이상의 파티션 열을 지정하여 언로드된 데이터를 Amazon S3 버킷의 폴더로 자동 분할할 수 있습니다. 예를 들어 마케팅 데이터를 언로드하고 연도, 월 및 일 열별로 분할하도록 선택할 수 있습니다. 이를 통해 쿼리에서 파티션 잘라내기 기능과 관련 없는 파티션 검색 건너뛰기 기능을 활용하여 쿼리 성능을 개선하고 비용을 최소화할 수 있습니다.
자세한 내용은 Amazon Redshift 설명서를 참조하십시오.
Amazon Redshift 데이터 레이크 내보내기는 Redshift 릴리스 버전 1.0.10480 이상에서 지원됩니다. Amazon Redshift의 가용성은 AWS 리전 표를 참조하십시오.