게시된 날짜: Apr 28, 2021
Amazon Redshift의 JSON 및 반정형 데이터에 대한 기본 지원이 정식 출시되었습니다. 이 기능은 반정형 데이터를 Amazon Redshift 데이터 웨어하우스에서 수집 및 저장할 수 있는 새로운 데이터 유형 'SUPER'를 기반으로 합니다. 또한, Amazon Redshift는 관계형, 반정형 및 중첩 데이터에 대한 SQL 호환 액세스를 위한PartiQL 지원을 포함합니다. Amazon Redshift에서 SUPER 데이터 유형 및 PartiQL을 사용하면 기존의 정형 SQL 데이터(예: 문자열, 숫자 및 타임 스탬프)와 반정형 SUPER 데이터를 통합한 고급 분석을 수행함으로써 우수한 성능, 유연성 및 사용 편의성을 달성할 수 있습니다.
SUPER 데이터 유형은 본질적으로 스키마가 없으며 Redshift 스칼라 값, 중첩 배열 또는 기타 중첩 구조로 구성될 수 있는 중첩 값을 저장할 수 있습니다. Amazon Redshift는 JSON 데이터를 구문 분석하여 SUPER로 변환하는 기능을 지원하며, 유사한 데이터를 기존 스칼라 열에 삽입하는 것보다 JSON/SUPER 데이터를 최대 5배 빠르게 삽입할 수 있습니다. PartiQL은 여러 AWS 서비스에서 채택된 SQL의 확장 버전입니다. PartiQL을 사용하면 효율적인 객체 및 배열 탐색, 중첩 해제, JOIN 및 집계와 같은 기존의 분석 작업을 사용한 유연한 쿼리 작성 등을 통해 스키마 없이 중첩된 SUPER 데이터에 액세스할 수 있습니다. 이에 따라 정형 데이터와 반정형 데이터의 조합을 검색하는 새로운 고급 분석을 수행할 수 있습니다. 데이터 엔지니어는 외부 서비스와 통합하지 않더라도 Redshift 클러스터에서 직접 삽입된 반정형 데이터에 대해 간소화되고 지연 시간이 짧은 ELT(추출, 로드, 변환) 처리 작업을 수행할 수 있습니다. ELT를 촉진하는 PartiQL 기능은 탐색 및 중첩 해제 외에도 스키마 없는 의미 체계, 동적 타이핑 및 유형 내부 검사 기능이 있습니다. 이제 사용자는 이러한 기능을 사용하여 수집된 각 소스에 대한 데이터 유형을 미리 검색하거나 진화하는 스키마를 처리하거나 데이터 쿼리 시 서로 다른 유형을 처리하기 위해 복잡한 SQL을 작성할 필요가 없으므로 스키마 없는 데이터를 훨씬 쉽게 수집 및 쿼리할 수 있습니다. 사용자는 구체화된 보기를 생성하여 반정형 데이터를 쉽게 파쇄할 수 있으며, 구체화된 보기를 자동으로 그리고 점진적으로 유지하면서 훨씬 더 빠른 분석 쿼리를 수행할 수도 있습니다.
모든 상업 리전에서 Amazon Redshift의 JSON 및 반정형 데이터에 대한 기본 지원 출시
설명서에서 Amazon Redshift의 JSON 및 반정형 데이터에 대한 기본 지원에 대해 자세히 알아보세요.