投稿日: Jan 28, 2021

AWS Glue DataBrew は、データセット用に以下の区切り文字オプションをサポートするようになりました。これにより、データ準備のためにさまざまな .csv ファイルと .tsv ファイルを DataBrew に柔軟に取り込むことができます。サポートされている区切り文字は以下のとおりです。

  • カンマ (,)
  • コロン (:)
  • セミコロン (;)
  • パイプ (|)
  • タブ (\t)
  • キャレット (^)
  • スペース ( )

AWS Glue DataBrew は、250 を超える事前構築された変換を提供して、当該変換なしでは手書きの変換を記述するのに数日または数週間を要するであろうデータ準備タスク (異常のフィルタリング、フォーマットの標準化、無効な値の修正など) を自動化します。データが準備されると、お客様はすぐに AWS とサードパーティーの分析および機械学習サービスで当該データを使用して、データをクエリし、機械学習モデルをトレーニングできます。

開始するには、AWS マネジメントコンソールにアクセスするか、またはノートブック環境に DataBrew プラグインをインストールして、DataBrew のドキュメントをご参照ください。