Amazon Web Services ブログ

Lambda、Step Functions、CloudWatch Events ルールで Amazon Forecast ワークフローを自動化する

Amazon Forecast は、機械学習 (ML) により、それまでの ML 経験を待つことなく、非常に正確な予測を生成できる完全マネージド型サービスです。Forecast は、製品需要の見積り、エネルギー需要の予測、人事計画、クラウドインフラストラクチャの使用状況の算定、トラフィック需要の予測、サプライチェーンの最適化、財務計画など、さまざまなユースケースに使用できます。 Forecast は完全マネージド型サービスであるため、プロビジョニングするサーバーや手動で構築する ML モデルはありません。また、使用した分だけお支払いいただくようになっており、最低料金や前払い料金を求められることはありません。Forecast を使用するために必要なことは、予測対象の履歴データをご提供いただくことだけです。オプションとして、予測に影響を与えると思われる関連データも併せてご提供ください。後者には、価格、行事、天候など、時により変化するデータと、色、ジャンル、リージョンなどカテゴリに関するデータの、両方が含まれます。このサービスでは、お手元のデータに基づいて機械学習モデルを自動的にトレーニングし、デプロイして、予測を取得するためのカスタム API を提供します。 この記事では、Amazon Redshift のシステムアーキテクチャについて説明します。それにより、Forecast を使ってハードウェアを管理し、お客様が Amazon Redshift クラスターを迅速にスピンアップできるようにします。このシステムアーキテクチャはユースケースに依存せず、複数のシナリオで参照してお使いいただけます。Amazon Forecast の使用方法の詳細については、「Amazon Forecast が一般公開されました」と「Amazon Forecast で自由選択した分位数での予測作成のサポートを開始」を参照してください。 ユースケースの背景 Amazon Redshift は、クラウド上の、ペタバイトまたはエクサバイト規模の完全マネージド型のデータウェアハウスサービスです。Amazon Redshift クラスターは、1 つ以上のノードで構成されています。優れた顧客体験を提供するためにできるだけ早くクラスターをセットアップするには、キャッシュプールを維持して、ウォームプールと一般的に呼ばれるデータベースソフトウェアが事前にインストールされた特定の数のノードを保持します。顧客が新しいクラスターをリクエストするたびに、Amazon Redshift は必要な数のノードをキャッシュプールから取得します。Amazon Redshift はすべてのリクエストを記録し、各エントリには Location、Timestamp、NumberOfNodes の属性が含まれます。次のテーブルにデータの例を示します。 LocationId Timestamp NumberOfNodes A 2019-01-01T18:05:00Z 5 A 2019-01-01T18:20:00Z 7 A 2019-01-01T18:52:06Z 11 A 2019-01-01T19:06:00Z […]

Read More

AWS Transfer for SFTP サーバーでネットワークのレイテンシーを最低限に抑える

自社の SFTP サーバーにアクセスするクライアントが世界中にいる状態ですか? 世界中にいるエンドユーザーがサーバーのエンドポイントからの地理的距離のせいでパフォーマンス面での問題に直面していませんか? ユーザーのロケーションに関係なくすべてのクライアントに差のないパフォーマンスを提供できたら良いのにとお考えではありませんか? この記事では世界中で AWS Transfer for SFTP (SFTP) サーバーを設定することにより、そうしたユーザーに向けて低レイテンシーを実現できるベスト プラクティスを解説しています。また、Amazon Route 53 (Route 53) でレイテンシーに基づいたルーティングを使用し、レイテンシーの最も低い SFTP サーバーエンドポイントへユーザーを振り分ける方法についても指南します。 Route 53: レイテンシーベースのルーティング 以下のスクリーンショットのセットアップについて考慮します。詳細については後述します。 SFTP サーバーエンドポイントはロンドンリージョンでホストされており、ロンドンとシドニーからこのエンドポイントへアクセスするクライアントがあります。想定したとおり、ロンドンのクライアントではエンドポイントとバケットの両方がユーザーと同じ地理的リージョンにあるため、短いレスポンス時間で快適に操作できます。しかし、シドニーのクライアントでは高レイテンシーと接続性の悪さに苦労しています。 すべての地理的リージョンに広がるユーザーに一貫した使用性を提供するために、ユーザーのいる場所から近いところにある AWS リージョンに SFTP サーバーをセットアップしました。その後、Route 53 のレイテンシーベースルーティングを使用して、クライアントコンピューターからレイテンシーをベースに最も近いサーバーへトラフィックをルーティングします。私たちは専用のリージョン Amazon S3 バケットを SFTP サーバーにマッピングすることで、さらにこのセットアップを強化します。リージョンの Amazon S3 バケットのデータは、クロスリージョンレプリケーション経由で、マスターの Amazon S3 バケットへとレプリケーションされます。これは、すべての SFTP サーバーの共通データストアとして機能します。 世界中に分散されたアーキテクチャ: 上記シナリオでは、ユーザー P、R、および S はそれぞれ、ロンドン、シドニー、バージニア北部より接続しています。sftp.example.com へ接続しようとすると、そのリクエストは DNS 解決のため、Route 53 […]

Read More

Savings Plan のアップデート: Lambda ワークロードで最大 17% の節約

昨年末、私は、Savings Plans についての記事を書きました。そして、指定された量 (1 時間あたりのドルで測定) の Amazon Elastic Compute Cloud (EC2) または AWS Fargate を使用する 1~3 年契約を締結する際に、どのように節約できるかを示しました。Savings Plans により、低価格でコンピューティング能力にアクセスしながら、コンピューティングサービス、インスタンスタイプ、オペレーティングシステム、およびリージョンを柔軟に変更できます。 今日の Lambda 本日、Compute Savings Plans が AWS Lambda 関数によって消費されるコンピューティング時間に適用され、最大 17% 節約できるようになったことをここにお知らせいたします。すでに 1 つ以上の Savings Plans を使用してサーバーベースの処理について節約している場合、アプリケーションを最新化し、シンプルなプログラミングモデル、自動関数スケーリング、ステップ関数など、たくさんの強力な Lambda 機能を活用しながら、コストを節約できます。 ユースケースに一定レベルのマイクロサービスの関数呼び出しが含まれている場合、Compute Savings Plans を最大限に活用できます。 AWS Cost Explorer は、Savings Plan を推奨するときに、Lambda の使用量を考慮するようになりました。AWS Cost Explorer を開き、[Savings Plans] 内の [Recommendations] をクリックして、推奨事項を確認します。これを行っているときに、推奨事項の作成に使用される期間、支払いオプション、および時間枠を変更できます。 […]

Read More

シーメンスが Amazon S3 データレイクの更新用に、フルマネージドのスケジューリングのしくみを構築した方法

シーメンスは 37 万人を超える従業員と 170 年の歴史を持つ、グローバルなテクノロジーをリードする企業です。シーメンスのネットワークとアセットを継続的に監視するシーメンスサイバーディフェンスセンター (CDC) が、同社をサイバー犯罪から保護しています。このときに生じる膨大なデータ負荷を処理するため、CDC は ARGOS と呼ばれる次世代の脅威検出と分析のためのプラットフォームを構築しました。ARGOS はハイブリッドクラウドソリューションで、フルマネージドの AWS のサービスを多用して、ストリーミング、ビッグデータ処理、機械学習を行います。 セキュリティアナリスト、データサイエンティスト、脅威インテリジェンスチーム、インシデントハンドラーなどのユーザーが、ARGOS プラットフォームのデータに継続的にアクセスします。さらに、さまざまな自動コンポーネントがデータを更新、拡張、削除し、情報の充実、データ品質の向上、PII 要件の実施を行ったり、スキーマの進化や追加データの正規化要件のためのデータ変更を行います。データを常に利用可能かつ一貫した状態に保つには、いくつかの課題があります。 このようなシナリオでは、オブジェクトベースのデータレイクは、従来のトランザクションデータベースと比較して、コストの観点では非常に有益ですが、アトミック更新をほとんど許可しない、あるいは極めて複雑でコストのかかる拡張を必要とします。この問題を解決するため、シーメンスは、クエリのパフォーマンスと可用性を損なうことなく、 Amazon S3 ベースのデータレイクでアトミックファイルを更新できるソリューションを設計しました。 この投稿では、S3 データ更新タスク用の使いやすいスケジューリングサービスであるこのソリューションをご紹介します。仮名化、匿名化、機密データの削除など、いくつかの目的のために、シーメンスはこのソリューションを使用しています。この投稿では、このソリューションを使用して、定義した時間が経過した後にデータセットから値を削除する方法を説明します。ソリューションのアーキテクチャは明確に定義されており、スタック全体が 200 行未満のソースコードで構成されているので、データ処理タスクをさらに追加することは難しくはありません。フルマネージドの AWS サービスだけをベースにしているため、運用オーバーヘッドが最小限に抑えられます。 アーキテクチャの概要 この投稿では、クエリメカニズムとしての継続的なデータ取り込みと Amazon Athena を備えた S3 ベースのデータレイクを使用します。取り込み後、定義した時間後の特定の値を自動的に削除することを目指します。Athena を介してデータを使用するアプリケーションとユーザーは、影響を受けません (たとえば、ダウンタイムや重複などのデータ品質に関する問題はありません)。 次の図は、このソリューションのアーキテクチャを示しています。 シーメンスは、以下のサービスとコンポーネントでソリューションを構築しました。 スケジューリングトリガー – 新しいデータ (JSON 形式など) を S3 バケットに継続的にアップロードします。 タスクスケジューリング – 新しいファイルが到着するとすぐに、AWS Lambda 関数が結果の S3 バケット通知イベントを処理します。処理の一部として、Amazon DynamoDB に Time […]

Read More

2 月 26 日のオンラインテックトーク: AWS ファイルストレージでデータ分析を加速化

2 月 26 日の AWS オンラインストレージテックトークでは、AWS ファイルストレージを使用したデータ分析の加速化についてご紹介します。どうぞお見逃しなく。 このテックトークは、午前 11:00~午後 12:00 太平洋時間 (午後 2:00~午後 3:00 東部時間) に開催されます。 多くのお客様が共有ファイルストレージを使用して、ビジネスに不可欠なデータサイエンスワークフローを加速しています。Python、MXNet、TensorFlow などの一般的なツール、Jupyter などの共有ノートブックシステムを使用する場合があります。 Amazon Elastic File System (Amazon EFS) は、AWS クラウドサービスおよびオンプレミスリソースで使用するための、シンプルでスケーラブルで弾力性のある完全マネージド型の NFS ファイルシステムを提供します。これにより、データサイエンスチームはデータを簡単に共有し、分析と洞察にかかる時間を短縮できます。このテックトークでは、EFS Infrequent Access ストレージクラスを活用してコストを最適化する方法など、データサイエンスホームディレクトリを Amazon EFS に移行するための一般的な課題とベストプラクティスについて説明します。開始方法を説明し、将来の考慮事項を検討します。 この 200 レベルのオンラインセミナーでは、以下のことを学びます。 当社のお客様がデータサイエンスファイルストレージソリューションに Amazon EFS を選択している理由をご覧ください。 最新の Amazon EFS 機能を利用して、トレーニングデータとモデルファイルを保護してバックアップします。 Amazon SageMaker など、サービスとの統合による洞察の加速化をご覧ください。 参加対象者 データサイエンティスト 開発者 クラウドアーキテクト IT ディレクター IT マネージャー […]

Read More

AWS ALB Ingress Controller の App Mesh への統合

AWS App Mesh は、アプリケーションレベルのネットワークを提供するサービスメッシュであり、サービスが複数のタイプのコンピューティングインフラストラクチャ間で簡単に相互通信できるようにします。App Mesh はサービスの通信方法を標準化し、エンドツーエンドの可視性を提供し、アプリケーションの高可用性を確保します。 AWS ALB Ingress コントローラーは、Kubernetes ユーザーがクラスターで Ingress リソースを宣言するたびに ALB と必要なサポートのための AWS リソースの作成をトリガーするコントローラーです。Ingress リソースは、ALB を使用して HTTP[s] トラフィックをクラスター内の異なるエンドポイントにルーティングします。 App Mesh では、EKS の内部トラフィック (別名 East-West トラフィック) は、App Mesh コントロールプレーンによって制御される Envoy サイドカーによって管理されますが、外部アクセス (別名 North-South トラフィック) は App Mesh によって管理されません。North-South トラフィックを East-West トラフィックに接続するオプションとしては次のようなものがあります。 Ingress ゲートウェイとしての Gloo。 App Mesh のゲートウェイアプリケーションを使用する ALB Ingress Controller。 App Mesh へのイングレスとしての […]

Read More

AWS Security Hub PCI DSS v3.2.1 コンプライアンス標準の使用方法

2020年2月13日に、AWS は、AWS Security Hub に Payment Card Industry Data Security Standard (PCI DSS) バージョン 3.2.1 要件の部分的なサポートを追加しました。 この更新により、PCI DSS の要件のサブセットを検証でき、継続的かつ自動化されたチェックを実施することにより、進行中の PCI DSS 準拠の活動を支援します。新しい Security Hub コンプライアンス標準により、AWS リソースを積極的に監視することも容易になります。これは、カード会員データの保存、処理、または送信に関与する企業にとって重要です。また、Security Hub コンプライアンス標準のセキュリティスコア機能もあり、PCI DSS 評価の準備をサポートできます。

Read More
Weekly AWS

週刊AWS – 2020/2/17週

みなさん、こんにちは。ソリューションアーキテクトの下佐粉です。 今週も週刊AWSをお届けします。 仕事や何か作業をする際にイヤホンで外の音を遮断して集中するという方は多いのではと思いますが、私はある程度環境音が聞こえている方が好みです。なので普段はあまりイヤホンを使わなかったのですが、最近「ながら聞き」タイプの開放型イヤホンを購入して、快適に使っています。カフェで音楽が流れているような感じの使用感ですね。耳栓的な圧迫感が苦手とか、環境音があった方が安心できるという方にお勧めです。 それでは、先週の主なアップデートについて振り返っていきましょう。

Read More

AWS Black Belt オンラインセミナーのご案内 (2020 年 3 月)

こんにちは!AWS Webinarチームです。 3 月の AWS Black Belt オンラインセミナーについてご案内させて頂きます。 3 月は、5 本のWebinarを実施いたします!ぜひお役立てください。 今回は 皆さまから多くリクエストいただきましたセッションや、Black Belt では初のマイクロサービスアーキテクチャについてのセッションも配信予定です。 視聴方法: オンラインセミナー登録ページよりお申し込みください 3 月のスケジュール AWS Cloud Development Kit (CDK) 2020 年 3 月 3 日 (火) | 12:00 – 13:00 | IT 知識レベル:★★★☆☆ | AWS 知識レベル:★★★☆☆ AWS CDK は AWS の環境を管理するコードを一般のプログラミング言語を使って記述できるフレームワークです。このセミナーでは AWS CDK と 他の管理ツール(CloudFormationなど) との位置付け、TypeScript/Python/Java/.NET での実装方法、 実環境での利用 Tipsまで、CDK を活用するための最新情報をまるごとお伝えします。 […]

Read More

[AWS Black Belt Online Seminar] オンプレミスとAWS間の冗長化接続 資料及び QA 公開

先日 (2020/02/19) 開催しました AWS Black Belt Online Seminar「オンプレミスとAWS間の冗長化接続」の資料を公開しました。当日、参加者の皆様から頂いた QA の一部についても共有しております。 20200219 AWS Black Belt Online Seminar オンプレミスとAWS間の冗長化接続 AWS クラウドサービス活用資料集(すべての過去資料が閲覧できます) Q. リージョンをまたいだ冗長構成(Act/Act、Act/Sby)のベストプラクティスはありますでしょうか? A. 多くの場合、オンプレミス拠点から一番近くにある Direct Connect ロケーションへ接続したほうが、レイテンシーの面で有利になります。そのため、レイテンシーが短い接続を Active、他方を Standby とする方が一般的かと考えます。 一方で、こういったレイテンシーの違いによるアプリケーションへの影響が無い場合、両方の接続で帯域を使い切る事ができるActive-Activeを選択する事も有効です。 どちらの方式を選択するかは、ご利用のアプリケーションの要件からご判断ください。 — 今後の AWS Webinar | イベントスケジュール 直近で以下を予定しています。各詳細およびお申し込み先は下記URLからご確認いただけます。皆様のご参加をお待ちしております。 — AWSome Day Online Conference 「AWSome Day Online」は、実際に足を運んでいただく 1 日の AWSome Day の内容を 2.5 時間に凝縮し、AWSの主要サービスや基礎知識をポイントを押さえて紹介いたします。技術的な面だけではなく、AWS クラウドを学ぶために必要となる知識を身に付けたい方、エンジニアのみならず、営業職、プリセールス職、学生まで幅広い方々におすすめします。 日時: 3 […]

Read More