Amazon Web Services ブログ

AWS オンラインテックトーク – 2018 年 5 月および 6 月前半

AWS オンラインテックトーク – 2018 年 5 月および 6 月前半 AWS では今月も注目の新サービスやソリューションのベストプラクティスについてご紹介します。また、初の re:Invent 2018 ウェビナーシリーズ、「How to re:Invent」も企画しています。 お見逃しないよう早目にご登録ください。 注意 – すべてのセッションは無料で、太平洋時間です。 今月の主なテックトーク 分析 & ビッグデータ 2018 年 5 月 21 日 | 午前 11:00 ~ 11:45 (太平洋時間) – Integrating Amazon Elasticsearch with your DevOps Tooling – Amazon Elasticsearch Service をいかに簡単に DevOps へ統合し、ログデータから価値ある詳細情報を得ることができるかについて学びます。 2018 年 5 月 […]

Read More

Amazon SageMaker で量子系をシミュレートする

Amazon SageMaker は、開発者やデータサイエンティストがあらゆる規模の機械学習モデルを迅速かつ簡単に構築、訓練、およびデプロイすることを可能にする完全マネージド型サービスです。しかし、機械学習 (ML) のワークフローを能率化するだけでなく、Amazon SageMaker は科学技術向けコンピューティングタスクの大規模なスペクトルを実行したり、並列化したりするためのサーバーレスでパワフルな使いやすいコンピューティング環境も提供します。このノートブックでは、TensorFlow と Amazon SageMaker の「bring your own algorithm (BYOA)」 (独自のアルゴリズムを活用する) 機能を併用して、シンプルな量子系をシミュレートする方法についてご紹介します。 この演習を実行するにあたり、Amazon SageMaker にアクセスできる AWS アカウントと Python および TensorFlow に関する基礎知識が必要になります。 量子系の超放射: 簡単な説明 これから私たちがシミュレートする量子効果は超放射として知られています。 これは、ある一定の環境下で、独立した発光体 (個別の原子など) が自然に量子コヒーレンスを増加させ、1 つの実体として協調的に動作するという現象を示します。コヒーレンスが増大したことで、このグループが高輝度のバーストを単発で発します。このバーストは独立した粒子のグループから生じると予想される輝度の N 倍 (!) も強いものである、この場合の N とはグループの粒子の数を示します。興味深いことに、この影響は粒子との相互作用に基づくものではなく、むしろ、粒子の明視野との相互作用と対称的な性質によってのみ生じます。 以下の図では、発光プロファイルが独立型 (上のパネル) と超放射型 (下のパネル) の粒子集団で明確に異なっていることがわかります。超放射は空間的に方向を持った、短時間の高輝度パルスを生じさせます。これは従来の急激に崩壊する放出プロファイルとは異なります。 超放射は多くの様々な量子系で見られ、 提示されてきました。ここでは TensorFlow と Amazon SageMaker を使って、ダイヤモンド窒素-空孔中心の核スピン集団からの超放射をシミュレートする方法を見ていきましょう。 Amazon SageMaker における科学的コンピューティングの構造 Amazon […]

Read More

[AWS Black Belt Online Seminar] AWS Greengrass で実現するエッジコンピューティング 資料及び QA 公開

こんにちは、マーケティングの鬼形です。 先日 (2018/5/8) 開催しました AWS Black Belt Online Seminar「AWS Greengrassで実現するエッジコンピューティング」の資料を公開しました。当日、参加者の皆様から頂いた QA の一部についても共有しております。

Read More

Redis 用 Amazon ElastiCache を使用してリアルタイムの販売分析ダッシュボードを構築する方法

Amazon ElastiCache について説明すると、ほとんどの場合、読み取り負荷の高いデータベースワークロードのパフォーマンスを向上させるという文脈になります。リードスルーまたはライトスルーのパターンを採用するようにアプリケーションを更新し、キャッシュ内のデータを最新に保ち、データベースの負担を軽減します。この文脈で使用すると、ElastiCache はデータをメモリにキャッシュして大量のワークロードを高速化し、ミリ秒未満のデータ取得パフォーマンスを実現します。さらに、Redis 用 Amazon ElastiCache は、マルチ AZ 設定の自動フェイルオーバーにより、ワークロードの可用性とフォールトトレランスを向上させます。 ただし、ElastiCache は、ワークロードをより効率的にするだけでなく、新しい機能を提供するなど他にも多くの利点をもたらすことができます。この記事では、Redis 用 ElastiCache で構築されたリアルタイムの販売分析ダッシュボードの文脈で、こうした機能のいくつかを検討します。 この例で使用されているダッシュボードのコードとサンプルアーキテクチャは、GitHubの aws-elasticache-retail-dashboard リポジトリから入手できます。 ダッシュボードの指標 このダッシュボードは、広範な製品カタログを持つ大量の電子商取引サイトについて、ほぼリアルタイムの指標を提供します。リレーショナルデータベースを使用してこうしたダッシュボードを構築するには、リソースを集中的に使用するクエリの複雑なセットが必要です。代わりに、少数の Redis コマンドを使用してこのデータを追跡します。 このダッシュボードは、5 つの主要な一般的販売指標に焦点を当てています。 毎日の注文数 まず、簡単な指標である、毎日の注文数から始めます。注文を受け取るたびに、注文数を 1 つ増やします。操作は高速でアトミックなので、リレーショナルデータベースのテーブルの行数を数える必要はありません。毎日、新しいキーを作成し、Redis は初期値 0 のキーを作成します。ダッシュボードは当日の注文数にのみ関係しています (履歴データは後で取り上げます)。 2018 年 3 月 11 日の注文数を増やすには、指定したキーに保存されている整数値をインクリメントする、Redis INCR 操作を使用します。キーが存在しない場合は、操作が実行される前に値が 0 に設定されます。 INCR orders:20180311 これで、次のように整数形式の値を取得できます。 GET orders:20180311 当日販売された一意の商品の数 毎日の注文数をカウントしたので、次はそれらの注文で販売されている商品に関するデータを収集しましょう。まず、毎日販売されている一意の商品の数 (SKU または一意の ID による) を追跡しましょう。注文数の指標と同様に、同じ結果を作成する SQL クエリ […]

Read More

AWS DMS は、R4 タイプのインスタンスをサポートするようになりました。適切なインスタンス AWS DMS 移行を選択できます

AWS Database Migration Service (AWS DMS) でAmazon EC2 の R4 メモリに最適化されたインスタンスのサポートをお知らせ致します。これらのインスタンスには、より多くのメモリとより高いネットワーク帯域幅があり、高いスループットとメモリ集約的な操作を必要とする移行をサポートするのに役立ちます。 ここには、DMS でサポートされているインスタンスの一覧が表示されます。 DMS が新しいインスタンスクラスをサポートするようになったので、どのインスタンスクラスを選択するのか迷うかもしれません。 状況に適したインスタンスクラスはどれですか? この質問に答える前に、各インスタンスクラスを DMS でどのように使用できるかを見てみましょう: T2インスタンス:軽負荷のために設計されており、時折パフォーマンスが急上昇します。このインスタンスクラスを使用して、DMS について学習し、小さな断続的なワークロードの移行をテストすることをお勧めします。 C4インスタンス:クラス最高のCPU性能を備えた計算集約型ワークロード向けに設計されています。DMSは、特に異機種間の移行やレプリケーション(たとえば、Oracle からPostgreSQL へ)を実行する場合、CPUを集中的に使用することがあります。C4インスタンスは、これらの状況に適しています。 R4インスタンス:メモリ集約型ワークロード用に設計されています。これらのインスタンスには、vCPUあたりのメモリが含まれます。DMS を使用するハイスループットトランザクションシステムの継続的な移行やレプリケーションは、時には大量のCPUとメモリを消費することがあります。R4インスタンスは、これらの状況に適しています。 これらの点を念頭に置いて、AWS DMS を使用して移行を実施する際に、C4 および R4 タイプのインスタンスが要件に適合できるかどうかを理解するための例をいくつか紹介します。 フルロードフェーズでの R4 の利点 以前のブログ記事で議論したように、PostgreSQL は、コンマ区切り値(CSV)ファイルを使用して値が引き渡されるターゲットエンジンです。この場合、DMS は移行を開始するときに次のことを行います: DMS は、ソーステーブルからレプリケーションインスタンスメモリにデータをアンロードして、データを含む CSV ファイルを準備します。この CSV ファイルのサイズは、パラメータ maxFileSize に依存します。 DMS は CSV ファイルをディスクに保存し、COPYコマンドを使用してデータを PostgreSQL にプッシュします。 このタイプの移行を実行する場合、maxFileSize 値を大きくするとスループットが大幅に向上します。私たちは、maxFileSize の最大が1,048,576KB(1.1 GB)まで向上し、移行速度が大幅に改善されていることを実際に確認しました。バージョン […]

Read More

AWS Glue を使用して非ネイティブ JDBC データソースに対して ETL ジョブを実行する

AWS Glue は、抽出、変換、およびロード (ETL) のための完全管理型サービスで、これで分析のためのデータの準備と読み込みが簡単になります。AWS マネジメントコンソールで数回クリックするだけで ETL ジョブを作成し実行することができます。AWS Glue をデータストアにポイントするだけです。AWS Glue はデータを検出し、関連付けられたメタデータ (テーブル定義やスキーマなど) を AWS Glue データカタログに保存します。 AWS Glue には、IP 接続がある限り、AWS やその他の場所で JDBC ドライバーを用いたデータソースへのネイティブコネクタがあります。この記事では、現在のところ AWS Glue でネイティブにサポートされていないデータソースに接続する方法を示します。IBM DB2 と SAP Sybase の 2 つのデータソースに対する ETL ジョブへの接続と実行をご紹介します。ただし、他の JDBC アクセス可能データベースと同じプロセスを使用することもできます。

Read More

AWS SMSを使用したSAPワークロードのAWSクラウド移行

この記事は、Amazon Web Services (AWS)のソリューション アーキテクト、Harpreet SinghとDevendra Singhによるものです。 AWS Server Migration Service (AWS SMS)は、オンプレミスのVMware vSphereあるいはMicrosoft Hyper-Vの仮想マシンをAWSクラウドに移行するためのエージェントレスサービスです。このブログ記事では、AWS SMSの主な利点を説明し、このサービスを使用して仮想化されたオンプレミス(またはプライベートクラウド)のSAPワークロードをAWSクラウド上のAmazon Elastic Compute Cloud (Amazon EC2) インスタンスに移行する方法を説明します。 AWS SMSを使用することの利点を以下にいくつか記載します: 簡略化された移行: ソース環境を設定した後、AWSマネジメントコンソールからレプリケーションジョブをスケジュールすることで、仮想マシンを簡単に移行できます。レプリケーションからAmazon Machine Image (AMI)の作成は、レプリケーションジョブを実行した時に自動的に処理される4段階のプロセスから成ります。 増分移行: AWS SMSはライブ環境を増分的にレプリケーションすることができ、移行プロセスを大幅にスピードアップすることができます。本稼働環境がAWSクラウドにレプリケーションされている間も、本稼働環境を利用し続けることができます。 ダウンタイム最小化: 増分レプリケーション中は本稼働運用に影響ありません。ただし、最終的なレプリケーション(カットオーバー)にはダウンタイムが必要です。 並列移行: AWS SMSでは、複数の仮想マシンを並行して移行できます。この機能を使用すると、ランドスケープ全体を移行することができます(例えば、すべての開発システムを一度に移行し、それから品質保証システムを移行するなど)。 AWS SMSは無償で使用できます。ただし、レプリケーション中は、Amazon Elastic Block Store (Amazon EBS) スナップショットが作成され、Amazon Simple Storage Service (Amazon S3)にこれらのスナップショットが保存されるため、これらのリソースに関連するコストが発生します。料金についての情報は、AWSウェブサイトを参照してください。 このブログ記事では、AWS SMSの一般的なレプリケーションプロセスについて説明し、次にAWS SMSを使用したSAPワークロードの移行方法について説明します。

Read More

Apache MXNet で事前にトレーニングを受けたモデルを使用する

このブログ記事では、Apache MXNet で事前トレーニングを受けたモデルの使用方法について解説します。複数モデルを試してみようと思われた理由は? 最高の精度をもったモデルを選ばないのはなぜでしょう? この記事の後半で説明するように、同じデータセット上でこれらのモデルがトレーニングを受け最高の精度を得るために最適化されたとしても、個々のイメージではその動作にわずかながら違いが生じます。また、予測速度も変動する可能性があります。これは多くのアプリケーションにとって重大な要素です。事前にトレーニングされたモデルをいくつか試すことで、自分のビジネス課題を解決するのに最適なモデルを見つけることができます。 まず、Apache の MXNet モデルズーから、3 つのイメージ分類モデルをダウンロードしてみましょう。 VGG-16 (研究報告)、ImageNet Large Scale Visual Recognition Challenge (ImageNet 大規模ビジュアルリコグニッションチャレンジ) における 2014 年度の分類最優秀モデル。 Inception v3 (研究報告)、GoogleNet の発展、オブジェクト検査での 2014 年度最優秀モデル。 ResNet-152 (研究報告)、複数カテゴリにおける 2015 度最優秀モデル。 各モデルについて次に示す 2 種類のファイルをダウンロードする必要があります。 ニューラルネットワークの JSON 定義を含むシンボルファイル: レイヤー、接続、アクティベーション機能など。 全接続加重、バイアスの値を保存する加重ファイルで別名パラメーター。トレーニングフェーズ中にネットワークにより習得。 # MacOS users can easily install ‘wget’ with Homebrew: ‘brew install wget’ !wget http://data.dmlc.ml/models/imagenet/vgg/vgg16-symbol.json -O […]

Read More

EC2 の – H1 インスタンス料金値下げ

EC2 の H1 インスタンスは、ビックデータアプリケーションに 2 〜 16 テラバイトの高速で高密度なストレージ を提供し、シーケンシャル I/O に高スループットを提供するように最適化されています。拡張ネットワーキングをサポートし、32 〜 256 ギガバイトの RAM を提供、およびベース動作周波数 2.3 GHz の Intel Xeon E5-2686 v4 プロセッサーを搭載しています。 米国東部 (バージニア北部)、米国東部 (オハイオ)、米国西部 (オレゴン)、および欧州 (アイルランド)リージョンの H1 インスタンスのオンデマンド、リザーブドインスタンス料金をまもなく 15% 値引することをお知らせいたします。 — Jeff;

Read More