投稿日: Nov 17, 2023
AWS Glue for Apache Spark が、Amazon OpenSearch Service 向けのネイティブ接続をサポートするようになりました。これにより、ユーザーは OpenSearch コネクタライブラリをインストールまたは管理しなくても、Amazon OpenSearch Service からデータを効率的に読み書きできるようになります。ユーザーは、OpenSearch Service のインデックスに保存されたデータを、AWS Glue Studio のコード不要のドラッグアンドドロップで利用できるビジュアルインターフェイス内のソースまたはターゲットとして、または AWS Glue ETL ジョブスクリプトで直接使用できるようになりました。この新しいコネクタを AWS Glue の ETL (抽出、変換、ロード) 機能と組み合わせると、ETL パイプラインの作成が容易になり、ETL デベロッパーはデータパイプラインの構築と保守にかかる時間を節約できます。
使用を開始するには、AWS Glue データカタログ内に Amazon OpenSearch Service の新しい接続を作成し、Glue ETL ジョブに Amazon OpenSearch Service のソースまたはターゲットを追加します。OpenSearch Service から読み込む場合、デベロッパーは OpenSearch Service のインデックス全体をソースとして選択するか、クエリを送信して特定のインデックスデータを選択できます。OpenSearch Service に書き込む場合、ユーザーは OpenSearch Service のインデックスに結果を読み込む前に、Glue でデータのエンリッチメント、クレンジング、変換を行うことができます。これらの機能により、ETL デベロッパーはさまざまなシナリオで OpenSearch Service と AWS Glue を使用できるようになります。