Amazon Web Services ブログ

Amazon EKS – 一般向け利用を開始

Amazon Elastic Container Service for Kubernetes を発表し、re:Invent 2017 の期間中にお客様をプレビューにご招待しました。本日謹んで、Amazon EKS が、お客様が利用可能な実稼働状態に達したことをお知らせいたします。その Kubnernetes 適合性が認証され、既存の Kubernetes ワークロードを実行できるようになりました。 Cloud Native Computing Foundation の最新のデータによれば、Kubernetes を実行している全企業の 57% が AWS は 選択しており、Kubernetes 環境としては AWS が先頭を走っています。Kubernetes はお客様の IT 戦略のコアであり、毎週 AWS で数億ものコンテナを実行しています。Amazon EKS は Kubernetes クラスターのビルド、保護、操作、保守のプロセスを簡略化し、Kubernetes クラスターをゼロから設定することなく、アプリケーションのビルドに集中したいと考える組織にコンテナベースのコンピューティングの便益をもたらしています。 AWS インサイド Amazon EKS は AWS クラウド内で実行できるため、多くの AWS サービスと機能を大いに活用しながら、Kubernetes に関する既知の知識すべてをそのまま有効に適用できます。概要は以下の通りです。 Multi-AZ – Kubernetes コントロールプレーン (API サーバーおよび […]

Read More

Amazon SageMaker コンソールがトレーニングジョブのクローン作成サポートを開始

本日、トレーニングジョブのクローン作成機能を立ち上げましました。 Amazon SageMaker コンソール上で既存のものに基づいてトレーニングジョブを作成することがとても簡単になりました。 異なるトレーニングセットおよび同一設定を使い、 Amazon SageMaker 上で、複数のトレーニングジョブを実行するのが一般的なやり方です。 特定のハイパーパラメータや、基礎となるコンピューティングリソースを調整し、モデルを再トレーニングすることもよく行われます。 このようなシナリオでは、既存のトレーニングジョブをベースに新しいトレーニングジョブを作成することが望ましいです。こうした要件に対処するため、Amazon SageMaker は AWS 管理コンソールを使用して、既存のトレーニングジョブのクローン作成をサポートできるようになりました。 コンソールを使えば、既存のトレーニングジョブを複製するのは簡単です。 Amazon SageMaker コンソールで、左側のナビゲーションペインに表示される Training、そして Training jobs を選択してください。 そうすれば、これまでに作成した全てのトレーニングジョブのリストが表示されます。 例えば、新しいトレーニングジョブを作成したいとしましょう。 Training jobs リストの中にあるジョブ (xgboost-2018-06-05-17-19-32-703) を例とします。 同じ設定を用いて、別のデータセットに対しても xgboost-2018-06-05-17-19-32-703 トレーニングすることができます。 トレーニングジョブを最初から作成するには、Create training job を選択する代わりに、 xgboost-2018-06-05-17-19-32-703 をチェックし、Clone を選択して、Clone training job のページを開くだけです。 ジョブの設定は、元の設定 xgboost-2018-06-05-17-19-32-703 とほぼ同じです。ただし、接尾辞が元のジョブ名に自動的に追加された点が異なります。 同じトレーニングプロセスを再実行したい場合は、何も変更をせずにページの一番下にある Create training job を選択してください。 別のデータセットを使用するので、トレーニングジョブ名は好きなように変更してください。 この例では、 xgboost-mydataset を使用します。 ページ下にある […]

Read More

AWS Deep Learning AMI に Horovod が追加され、Amazon EC2 P3 インスタンスで、より高速なマルチ GPU TensorFlow のトレーニングが可能に

この AWS Deep Learning AMI は、よく普及しているオープンソースの分散トレーニングフレームワークで、複数 GPU で TensorFlow トレーニングを拡張します。Ubuntu や Amazon Linux 用で、 Horovod といっしょにインストールおよび全設定が完了済みです。 これは、 TensorFlow 1.8 の最適化ビルドのアップデート版で、5 月初旬に開始されました。 このカスタムビルドの TensorFlow 1.8 は、高度に最適化されたソースから直接構築され、Amazon EC2 C5 および P3 インスタンスのストック TensorFlow 1.8 と比較して、トレーニングパフォーマンスが向上しています。 マシンラーニングの開発者は、AMI に Horovod を追加すれば、TensorFlow トレーニングを P3 などの Amazon EC2 GPU インスタンス上で、1 つの GPU から複数の GPU にすばやくスケールアップすることが可能となり、トレーニングパフォーマンスをさらに向上させることができます。 開発者は、パラメーターサーバーを使用する標準の TensorFlow 分散トレーニングモデルと比較して、コードの変更を少なくし、より高いマルチ GPU トレーニングパフォーマンスが可能となります。 Amazon […]

Read More

複数の GPU に対する深層学習トレーニングをスケーリングするためのハイパーパラメーターの調整の重要性

複数の GPU による並列プロセスは、深層モデルのトレーニングのスケーリングを行う上で重要なステップです。トレーニングを繰り返すたびに、一般的に、ミニバッチと呼ばれるデータセットの小さなサブセットがプロセスされます。単一の GPU が使用可能の場合、それぞれのトレーニングの繰り返しにおけるミニバッチの処理は、この GPU により取り扱われます。複数の GPU でトレーニングするとき、ミニバッチはプロセスの負荷を均等に分散するために使用可能な GPU 全体に分割されます。各 GPU を完全に使用するためには、各追加 GPU でミニバッチのサイズを直線的に増大させる必要があります。ミニバッチのサイズは、トレーニング速度に影響を与えるだけではなく、トレーニングされるモデルの質にも影響を与えます。ミニバッチのサイズが大きくなると、他のハイパーパラメーターを微調整して、類似するモデルの質でより高速なトレーニングができるようにすることが重要です。 Gluon によるマルチ GPU と分散トレーニング 最新の真相学習モデルにより必要な広範なデータの量により、複数の GPU と分散マシンにスケーリングすることで、調査と本番稼働のための大幅な時間節約となる可能性があります。Amazon SageMaker や Amazon Elastic Compute Cloud (Amazon EC2) のようなサービスでは、数百 GPU の分散トレーニングをセットアップすることは、痛みのないだけでなく、正確な使用量に対して支払うだけで非常に経済的で、高価で十分に活用されていないハードウェアフリートを維持する必要はありません。 Apache MXNet は、柔軟でより効率的な深層学習プラットフォームです。 これは、複数のホストにわたるマルチ GPU と分散トレーニングに特に適しています。Apache MXNet の Gluon ライブラリは、深層学習のための明確で正確、さらにシンプルな API を提供します。gluon による複数の GPU のトレーニングおよび複数のマシンによる分散トレーニングに関するチュートリアルでは、マルチ GPU と分散トレーニングの容易なセットアップをデモンストレーションします。 トレーニングのハイパーパラメーター トレーニングのハイパーパラメーターは、勾配降下法によっては学習できないが、最終的なモデル品質に影響を与えるすべてのパラメーターを構成します。これらのパラメーターは、学習速度およびモメンタムなどの最適化パラメーター、ランダムなカラーシフト量などの増強パラメーター、および他の学習以外のパラメーターを含みます。 MXNet Gluon API は、すべての […]

Read More

この一週間の顔認識と Amazon Rekognition に関する公開ディスカッションについて弊社が考えること

この一週間、顔認識、監視、および個人の自由に関する、Amazon Rekognition の役割について多くの議論を見てきましたが、弊社の考えを共有したいと思ってます。 Amazon Rekognition は、弊社が 2016 年に発表したサービスです。開発者がディープラーニングなどの新しいテクノロジを簡単にかつ低料金で開発に利用できるようになりました。サービスを開始して以来、お客様は社会 (人身売買の防止、児童労働搾取の防止、失った子供との再会、子供向けの教育アプリの構築など) と組織 (マルチファクタ認証導入によるセキュリティ強化、画像検索の容易化、玄関先の商品の盗難防止など) の両面において、Amazon Rekognition の画像と動画の分析機能を活用してます。アマゾン ウェブ サービス (AWS) は、単にこれらのサービスプロバイダではありません。私たちは画像およびビデオ分析のテクノロジーが公共部門や法執行機関も含む組織においてどのように良い結果をもたらすのかを見るのがとても楽しみです。規定 (以下、「AUP」) を定めており、「違法行為、他者の権利を侵害する行為、または他者に有害である可能性のある行為」に対して本サービスの使用を禁じています。これには、本質的にあらゆる種類の違法差別や正当なプロセスやプライバシー権の侵害など、第 4、第 5、および第 14 条修正に関する憲法上の権利を侵害することが含まれます。 当社の AUP に違反しているお客様は当社のサービスを使用することはできません。 しかし新しい技術力には常にリスクが存在します。新技術の採用を決定した組織は、責任をもった行動、または法的罰則や公然の非難を受ける覚悟が必要です。AWS はその責任を真剣に受け止めています。しかし、我々は有望な技術を悪事に利用されるのを恐れて、それらの使用を禁止するといったことは誤った方法だと考えています。もしコンピュータが悪用される可能性があるという理由で、人々がコンピュータの購入を規制された場合、世界は誤った方向に行くでしょう。私たちが毎日頼っている何千もの技術についても同様です。 それらの技術を責任を持って利用することで、技術がもたらす恩恵はリスクをはるかに上回っています。 お客様は Amazon Rekognition を使い素晴らしいスタートを切りました。この新技術がもたらすプラスの効果は日々大きくなっています。我々は責任ある利用をしているお客様を引き続きサポートすることができて嬉しく思っています。 -Dr. Matt Wood 氏、AWS の人工知能ゼネラルマネジャー

Read More

Amazon SageMaker のアップデート、東京リージョン、CloudFormation、Chainer、GreenGrass ML

本日、東京での AWS Summit で、Amazon SageMaker の多数のアップデートや新機能が発表されました。本日より、SageMaker が アジアパシフィック (東京) で利用可能になります!また、SageMaker は CloudFormation もサポートします。SageMaker Python SDK では、MXNet および Tensorflow に加えて、機械学習の新しいフレームワークである Chainer も利用できます。最後に、いくつかのデバイスでの Chainer モデルの実行に対するサポートが AWS Greengrass Machine Learning に追加されました。 Amazon SageMaker Chainer エスティメーター Chainer は、定評がある、柔軟で直感的な深層学習のフレームワークです。Chainer ネットワークは、ネットワークトポロジが順方向計算によって動的に定義される「Define-by-Run」スキームで動作します。これは、ネットワークのトポロジがデータとは別に定義される「定義と実行」スキームで動作する他の多くのフレームワークとは対照的です。多くの開発者は、ネイティブの Python の構造やツールでネットワークを書くことができるので、Chainer スキームを重宝しています。 幸いなことに、SageMaker で Chainer を使用することは、TensorFlow または MXNet のエスティメーターを使用するのと同じくらい簡単です実際には、既存のスクリプトを使用して、少し修正するだけで SageMaker でトレーニングすることができるので、さらに簡単かもしれません。TensorFlow または MXNet を使用する場合には、特定の署名を持つトレーニング機能を実装する必要があります。Chainer を使用する場合は、 SM_MODEL_DIR、 SM_NUM_GPUS、その他の環境変数から簡単に読み込めるので、スクリプトはより移植しやすくなります。既存のスクリプトを、 if __name__ […]

Read More

EC2 インスタンスの更新 – NVMe ストレージを搭載する M5 インスタンス (M5d)

今月はじめに NVMe ローカルストレージを搭載した C5 インスタンスの提供を開始し、近い将来に NVMe ローカルストレージを搭載したインスタンスタイプをさらに追加するとお伝えしました。 本日、NVMe ローカルストレージを搭載した M5 インスタンスを発表します。このインスタンスは 5 つのリージョンで即時ご利用可能で、コンピューティングリソースとメモリリソースのバランスが要求されるワークロードに非常に適しています。そのスペックは次のとおりです。 インスタンス名 vCPU RAM ローカルストレージ EBS 最適化された帯域幅 ネットワーク帯域幅 m5d.large 2 8 GiB 1 x 75 GB NVMe SSD 最大 2.120 Gbps 最大 10 Gbps m5d.xlarge 4 16 GiB 1 x 150 GB NVMe SSD 最大 2.120 Gbps 最大 10 Gbps m5d.2xlarge 8 32 […]

Read More

Amazon AppStream 2.0を使ったSAP GUIの展開

多くのお客様が、AWS上でSAP環境をより速く、より安全に、よりコスト効率よく稼働することで、デジタル変革を加速しています。これにより、AWSの規模とパフォーマンスのメリットが得られます。ただし、AWS上にSAP環境があるとはいえ、多くのユーザーがまだローカルコンピュータとローカルネットワーク上のSAP GUIを使用してアクセスしている可能性があります。 例えば、デスクトップ上でSAP GUIを実行し、AWS上のSAP環境との間で大量のデータをやり取りするユーザーは、待ち時間が長くなり、アプリケーションの動作が遅くなる可能性があります。同時に、SAP管理者は各ユーザーのコンピュータ上にあるオンプレミスのSAP GUIを管理して、最新のセキュリティパッチがすべて適用済みであることを確認する必要があります。そこで、AWS上でSAP環境を実行することができるように、AWS上でSAP GUIを実行することで、ユーザー体験をさらに向上させる方法があります。

Read More

SAP on AWS – 過去、現在、そして未来

私の多くのAWSの同僚がSAPPHIRE NOWの準備を進めていますが、AWSをSAP製品にとって最適な基盤とし、AWSをより良いものにするための計画を共有するためにも、これまでに実施してきたことを最新化する良い機会だと思いました。 これまでのストーリー 弊社のエンタープライズ顧客は、巨大なメモリ集約型のワークロードをAWSクラウドに持ち込みたいと思っています。特に、SAP HANAの大規模な本稼働環境の展開に重点を置いています。この重要な要件を満たすためにこれまで実施してきたことは以下のとおりです: 2016年5月 – クラウド上でSAP HANAを稼働する目的で構築された2TBメモリを搭載したx1.32xlargeインスタンスタイプを発表しました。 2016年8月 – 最大7ノード、つまり14TBメモリまでのスケールアウトクラスタのサポートとSAP認定を発表しました。 2016年10月 – テス​​ト用および小規模なSAP HANA展開に最適な、1TBのメモリを搭載したx1.16xlargeインスタンスタイプを発表し、両方のX1インスタンスのリージョンの利用可能範囲を拡大しました。 2017年5月 – 最大17ノード (34TBメモリ)の非常に大規模なスケールアウトのSAP HANAクラスタのSAPサポート、および4TBのメモリを搭載したx1e.32xlargeインスタンスタイプを発表しました。 2017年11月 – x1.32xlargeを最大25ノード (50TBメモリ)のさらに大規模なオンデマンドのSAP HANAクラスタのSAPサポートを発表しました。

Read More

インフラストラクチャを超えて: スタートアップのスピードでビジネス変革に取り組む方法

Steven JonesはAmazon Web Services (AWS)のテクノロジーディレクターで、KK RamamoorthyはSAPデジタルコンサルタントです。 私たちのお客様は、SAPワークロードをAWSに移行することでビジネス上の大きなメリットを享受されています。例えば、オーストラリア大手の包装・リサイクル会社であるVisyは、SAPシステムをAWSに移行したことで、数週間から数ヶ月かかっていたSAP導入のプロビジョニング時間を数日に短縮でき、パフォーマンスは最大46%向上しました。SAPワークロードをAWSに移行した他の多くのお客様にも、同様のメリットを享受いただいています (ケーススタディーをご参照ください)。 これらはビジネス上の具体的かつ重要なメリットですが、多くの場合、AWSへの移行がお客様のイノベーションの第一歩になります。お客様は、AWSインフラストラクチャ上で基盤を構築した後、SAPへの投資として、拡張または統合できるアプリケーションにより、ビジネス全体を変革し、費用を節約し、実験を行い、そして市場投入をより迅速に進めます。 お客様は、ビッグデータ & アナリティクス、IoT、アプリケーション & APIs、DevOpsの4つの柱に焦点を当てて、ビジネス変革を実現しようとされています。これらの重点分野はすべて、AWSの機械学習とコンピューティングサービスの強力な基盤によってサポートされています。これらのソリューションの多くは、AWSで直接構築することも、SAP Cloud Platform (SCP)を使用して構築することもできます。SCPは世界中の4つのAWSリージョンで利用可能です。 4つの柱によりビジネス変革を実現する好機として、詳細を知るためにSA​​PPHIRE NOWの現場を見に行きましょう。

Read More