投稿日: Nov 21, 2022
Amazon S3 では、Amazon S3 Select を使用して Trino でクエリを実行するパフォーマンスを最大 9 倍まで向上させました。Trino は、Amazon S3 に保存しているデータに対してインタラクティブ分析を実行するときに使用するオープンソースの SQL クエリエンジンです。S3 Select で、オブジェクト全体を返すのではなく、計算処理を「プッシュダウン」して、S3 データをフィルタリングします。Trino と S3 Select を使用して、オブジェクトからデータのサブセットのみを取得し、返されるデータ量を軽減し、クエリパフォーマンスを向上させます。
本日より、オープンソースの Trino に対する AWS の上流支援として、Trino と S3 Select を使用してクエリパフォーマンスを向上させることができるようになりました。S3 Select では、オブジェクト内部のデータのフィルタリングとアクセスという画一的で面倒な作業を Amazon S3 が処理することによって、Trino に転送して処理する必要があるデータ量を低減します。例えば、Amazon S3 に構築したデータレイクで今すぐ Trino を使用すると、S3 Select のフィルタリング機能を使用してインタラクティブなアドホッククエリをすばやく簡単に実行できます。
S3 Select と Trino を使用する方法の詳細については、S3 の技術ブログをご覧ください。S3 Select の Trino コネクタの詳細については、Trino の GitHub リポジトリにアクセスしてください。料金情報については、Amazon S3 の料金ページをご覧ください。