投稿日: Nov 17, 2023

AWS Glue for Apache Spark では、Teradata、SAP HANA、Azure SQL、Azure Cosmos DB、Vertica、MongoDB の 6 つの新しいデータベースコネクタのリリースを発表しました。これらのネイティブコネクタにより、ユーザーは各システムからデータを効率的に読み書きできます。コネクタライブラリをインストールしたり管理したりする必要はありません。ユーザーは、これらのデータベースを、AWS Glue Studio のコード不要のドラッグアンドドロップで利用できるビジュアルインターフェイス内のソースまたはターゲットとして追加したり、AWS Glue ETL スクリプトジョブでコネクタを直接使用したりできるようになりました。

Teradata、SAP HANA、Azure SQL、Vertica の場合、ユーザーは 1 つのテーブルを指定するか、カスタムクエリを入力してデータを選択できます。MongoDB では、ドキュメントコレクションを指定できます。Azure Cosmos DB では、コンテナを指定し、オプションでカスタムクエリを提供できます。ビジュアル ETL ジョブをオーサリングする場合は、ソースデータセットをプレビューして適切なデータをすばやく見つけることができます。また、これらのデータベースを ETL パイプラインのターゲットとして使用して、変換ステップからの出力を書き込むこともできます。

これらの機能により、ETL デベロッパーは 1 つのインターフェイス内におけるさまざまなデータ状況で AWS Glue とサポートされているデータベースを使用できます。利用を開始するには、AWS Glue 内で任意のデータベースへの新しい接続を作成し、それをソースまたはターゲットとして Glue ETL ジョブに追加します。

この機能は、AWS Glue が利用できるすべての商用 AWS リージョンで利用可能です。

詳細については、AWS Glue のドキュメントを参照してください。