Amazon Web Services ブログ

Tag: Amazon Athena

Use Amazon Athena with Spark SQL for your open-source transactional table formats

トランザクション処理可能なオープンテーブルフォーマット(OTF)のために Amazon Athena for Apache Spark と Spark SQL を活用する

Amazon Athena for Apache Spark は、インタラクティブに Spark プログラムを実行できるサーバーレスサービスです。この投稿では、Amazon Athena for Apache Spar を使って Apache Iceberg、Apache Hudi、Linux Foundation Delta Lake などのオープンソースのトランザクション処理可能なテーブルフォーマット (Open Table Format – OTF) を利用する方法をガイドします。

Amazon S3 におけるマルチテナント SaaS データのパーティション化と分離

多くの software-as-a-service (SaaS)アプリケーションはマルチテナントデータを Amazon Simple Storage Service(Amazon S3) に保存しています。Amazon S3 にマルチテナントデータを配置するには、バケットとキーにテナントデータをどのように分散させるかを考える必要があります。また、SaaS ソリューションのセキュリティ、管理性、パフォーマンスを損なうことなく行う必要があります。この記事では、 Amazon S3 でテナントデータをパーティション化する際に適用できるさまざまな戦略を説明します。

J.フロント リテイリングにおけるデータアナリスト育成の取り組みについて

本稿では、J.フロント リテイリング株式会社が取り組んでいるデジタル人財育成の中で、 AWS 上に構築した統合データ基盤を活用したデータアナリスト育成の取り組みについて紹介します。

統合データ基盤構成図

J.フロント リテイリングにおける統合データ基盤を活用したカスタマー・データドリブン経営の取り組み

本稿では、J.フロント リテイリング株式会社(以後、JFR)が、 AWS 上に構築した「統合データ基盤」を活用したカスタマー・データドリブン経営の取り組みについて紹介します。

Amazon S3 の API オペレーションを分析してストレージコストを最適化する

急速に変化するデータ環境(例:大規模なデータが頻繁に作成、共有、複製される状況)により、データストレージの需要が高まっています。多くのお客様は、費用対効果の高いデータの保存方法や、費用をかけずにデータから必要となるすべての情報を入手できる最適な方法を探しています。

製造業の拠点の在庫管理をサプライチェーンのデータレイクで改善

このブログシリーズでは 4 つのブログでこの課題に取り組みます。各々のブログで問題の解決のためのキーとなる要素を提示します。この最初のブログでは、分散したデータをまとめて正規化されたサプライチェーンのデータレイクをどのようにまとめ上げられるか、を説明します。次のブログでは、サプライチェーンのデジタルツインを使用してどのように物理的な製品フローを視覚的にモデル化するか、そして情報豊富なサプライチェーンのデータレイクにどうやって育て上げるかについて説明します。3 つ目のブログでは、デジタルツインの上位レイヤで、仕入れ計画のアプリケーションをどのように開発していくか、そして最後のブログでは LoRaWAN などの IoT 技術を使用して、広範囲に分散しデータ取得が難しい拠点からデータを取り、どのように自動的に、コスト効率よく、頻度が高く粒度の細かいデータを使用して、データレイクにデータを注入するかについて説明します。