投稿日: Apr 16, 2021
ユーザーのデータに、カスタムオペレーションを適用できるようにするユーザー定義関数 (UDF) が、現在、Amazon Athena で一般提供されています。Athena では、多種類の組み込み関数が提供されていますが、ユーザーは独自の関数を使用することでこれらの機能を拡張し、クエリ内で直接使用できます。これにより、データパイプライン内に複雑なデータ処理手順を設置する必要も一切なく、機密性のあるデータの編集や暗号化といった特定のユースケースに対応することが可能です。
お客様は、Athena Query Federation SDK を使用することで、UDF を Java で記述できます。Athena のクエリに含まれる UDF は、AWS Lambda により実行されます。UDF は SQL クエリの SELECT や FILTER 文節の中で使用でき、また、1 つのクエリ内に複数の UDF を含めることができます。Amazon Athena のユーザーは、Athena コンソールや API、そして JDBC ならびに ODBC ドライバーを通じて UDF の使用が可能です。
Amazon Athena の UDF では、AWS のサービスによる諸機能に加え、独自のアプリケーションもしくは API も活用していただけます。例えば、製品のレビューを分析しようとするアナリストには、ある言語で書かれたレビューの内容を、別の言語に翻訳する必要が生じることがあります。UDF を使用しない場合であれば、このデータを翻訳サービスにエクスポートし処理した後、再度インポートしなおすことになります。こういった用途および他のユースケースが、Amazon Athena UDF によりいかに簡素化されるかについては、「Translate and analyze text using SQL functions with Amazon Athena, Amazon Translate, and Amazon Comprehend (Amazon Athena などで SQL 関数を使用してのテキストの翻訳と分析)」を参照してください。また、AWS YouTube チャネルでは、チュートリアルの動画もご覧になれます。
Amazon Athena での UDF の使用開始には、次のリソースを参照してください。
- Athena ドキュメントの、「ユーザー定義関数を使用したクエリ」
- Athena Query Federation SDK を使用して独自の関数を記述する方法については、「Lambda 使用した UDF の作成とデプロイ」を参照してください。
- UDF 実装のサンプルは、GitHub の「Amazon Athena UDF Connector」 でご確認ください。