게시된 날짜: Jun 8, 2020
이제 Amazon Redshift 쿼리 결과를 텍스트 또는 Apache Parquet 형식으로 Amazon S3의 외부 테이블에 쓸 수 있습니다. 이 외부 테이블 메타데이터는 자동으로 업데이트되며 AWS Glue, AWS Lake Formation 또는 Hive Metastore 데이터 카탈로그에 저장할 수 있습니다. 따라서 데이터 레이크의 데이터를 손쉽게 공유하고 Amazon Redshift Spectrum이나 Amazon Athena, Amazon EMR, Amazon SageMaker 등의 다른 AWS 서비스를 이용해 바로 분석할 수 있습니다. Amazon Redshift Spectrum은 레이크 하우스 아키텍처를 구동하여 데이터 웨어하우스와 데이터 레이크 전반에 걸쳐 직접 데이터를 쿼리하고 조인하도록 지원합니다.
외부 테이블에 데이터를 쓰려면 CREATE EXTERNAL TABLE AS SELECT를 실행하여 새 외부 테이블에 쓰거나 INSERT INTO를 실행하여 기존 외부 테이블에 데이터를 삽입하면 됩니다. 이를 통해 익숙한 SQL 및 기존 ETL 및 BI 도구와의 완벽한 통합 기능을 활용하여 데이터 처리 파이프라인을 간소화하고 가속화할 수 있습니다. PARTITIONED BY 옵션을 사용하면 데이터를 자동으로 파티셔닝하고 파티션 잘라내기 기능을 이용하여 쿼리 성능은 높이면서 비용을 최소화할 수 있습니다. 예를 들어 기존 테이블에 마케팅 데이터를 쓰고 연도, 월 및 일 열별로 파티셔닝하도록 선택할 수 있습니다. 자세한 내용은 Amazon Redshift 설명서에서 CREATE EXTERNAL TABLE 및 INSERT를 참조하십시오.
Amazon Redshift 외부 테이블에 쓰기 기능은 Redshift 릴리스 버전 1.0.15582 이상에서 지원됩니다. Amazon Redshift의 가용성은 AWS 리전 표를 참조하십시오.