投稿日: Jun 30, 2021

AWS Glue スキーマレジストリが Apache Avro に加え、JSON スキーマ形式によるスキーマ定義に対応するようになりました。これにより、データストリーミングの形式に JSON スキーマを選ぶお客様が、データストリームの展開を集中的に管理し、独自のレジストリを管理する必要をなくすことができます。Glue スキーマレジストリは、Apache ライセンスのシリアライザーとデシリアライザーを通じて、Apache Kafka/Amazon Managed Streaming for Apache Kafka (Amazon MSK)、Amazon Kinesis Data Streams、Apache Flink/Amazon Kinesis Data Analytics for Apache Flink、および AWS Lambda 用に開発された Java アプリケーションと統合されます。

AWS Glue のサーバーレス機能である AWS Glue スキーマレジストリを使用すると、Apache Avro と JSON スキーマデータ形式で登録済みのスキーマを使用しながら、ストリーミングデータの展開過程を検証および制御できます。追加料金はかかりません。スキーマは、アプリケーションが生成するデータレコード (イベントとも呼ばれます) の構造と形式を定義します。データ生成アプリケーションがスキーマにフィールドを追加または削除すると、データ品質が低下し、ダウンストリームアプリケーションが影響を受ける可能性があります。Glue スキーマレジストリを使用することで、データの生成に使用されるスキーマが中央レジストリのスキーマに対して評価されるときのダウンストリームアプリケーション障害を削減できます。これにより、データの品質を中央で管理できるようになります。 

新たに追加された JSON スキーマデータ形式を使用することで、JSON スキーマを使用するお客様は、Apache Avro 用 Glue スキーマレジストリに提供された、同じ検証と展開による利点を得ることができます。Glue スキーマレジストリは、JSON スキーマの 4、6、7、2019-09 のドラフトと互換性があります。

JSON スキーマは、Glue スキーマレジストリが利用できるすべての AWS リージョンでサポートされています。詳細をご確認の上で使用を開始するには、Glue スキーマレジストリのドキュメントをご一読ください。