게시된 날짜: Nov 21, 2022
Amazon S3 Select는 Amazon S3 Select를 사용할 때 Trino에서 실행되는 쿼리 성능을 최대 9배까지 개선합니다. Trino는 Amazon S3에 저장된 데이터에 대한 대화형 분석 오픈소스 SQL 쿼리 엔진입니다. S3 Select를 통해, 전체 객체를 반환하는 대신 S3 데이터를 필터링하는 계산 작업을 '푸시다운'할 수 있습니다. Trino에서 S3 Select를 사용하면 객체의 데이터 하위 세트만 검색하여 반환되는 데이터의 양을 줄이고 쿼리 성능을 개선할 수 있습니다.
오늘부터 오픈소스 Trino에 대한 AWS의 업스트림 기여에 따라 S3 Select를 통해 쿼리 성능이 개선된 Trino를 사용할 수 있습니다. S3 Select는 객체 내 데이터를 필터링하고 액세스하는 부담스러운 작업을 Amazon S3로 오프로드 하여 Trino에서 전송 및 처리되어야 하는 데이터의 양을 줄입니다. 예를 들어 Amazon S3에 구축된 데이터 레이크가 있고 현재 Trino를 사용하고 있다면, S3 Select의 필터링 기능을 사용하여 빠르고 쉽게 대화형 임시 쿼리를 실행할 수 있습니다.
Trino에서의 S3 Select 사용에 대한 자세한 내용은 S3 기술 블로그를 참조하세요. S3 Select Trino 커넥터에 대한 자세한 내용은 Trino GitHub 리포지토리를 참조하세요. 요금 정보는 Amazon S3 요금 페이지를 참조하세요.