Amazon Web Services ブログ

Category: Compute

深層学習モデルのトレーニングに Gaudi アクセラレータ搭載の EC2 インスタンス

今日、深層学習のアプリケーションはかつてないほど多様化しています。自然言語処理、レコメンデーションシステム、画像認識、ビデオ認識などすべての機能において、高品質で十分に訓練されたモデルの利点を受けることができます。 このようなモデルを構築するプロセスは繰り返し行われます。初期モデルを構築し、Ground Truthデータでトレーニング、およびテスト推論を数回行い、モデルを改良してこれを繰り返します。深層学習モデルには多くのレイヤー (これが名前の由来です) が含まれ、各レイヤーは前のレイヤーの出力を変換します。トレーニングプロセスでは数学とプロセッサを多用し、GPU やその他のトレーニングアクセラレーター、ネットワーク、ローカルまたはネットワークストレージなど、トレーニングに使用されるシステムのほぼすべての部分で要求が行われます。この洗練された複雑な機能により、トレーニング時間とコストがかさみます。

Read More

Amazon Managed Service for Prometheus を使用してサービスメッシュコンテナ環境をモニタリングする

オブザーバビリティは、いかなるアプリケーションにとっても、システムの挙動や性能を理解する上で重要です。性能劣化や障害を検知して修復するには、多くの時間と労力を要します。これは、多くのマイクロサービスが動いていて、リクエストの処理がいくつかのサービスにまたがっているようなマルチテナント環境では、より一層困難となります。サービスメッシュは、マイクロサービス間のネットワーク通信を処理します。 そのような複雑な環境でトラブルシューティングをしていると、途方にくれてしまうこともあるでしょう。アプリケーションのトレースは性能の問題を特定するのに重要な役割を果たしますが、サービスメッシュのコンポーネントのメトリクスも重要です。Prometheus はオープンソースのシステムモニタリング・アラートのソリューションとして広く利用されています。

Read More

AWS Batch ベストプラクティスまとめ

この記事はプリンシパル HPC ソリューションアーキテクトの Pierre-Yves Aquilanti、AWS Batch のプリンシパルプロダクトマネージャの Steve Kendrex とプリンシパル HPC アプリケーションエンジニアの Matt Koop によるものです。 更新: 2021 年 10 月 5 日 セクション 2 に於けるサブネット CIDR ブロックのガイドラインを修正。 AWS Batch は、科学者や技術者が複雑なシステム構成を管理する必要なく、自由にスケールできる計算環境を提供するサービスです。2017 年に登場して以来、疫学、ゲームシミュレーション、大規模機械学習といった諸々のワークロードを稼動させる様々な業種や組織といったお客様に採用されてきました。 この投稿では、色々なお客様向けに計算環境の最適化をしてきた経験を元に、私達が作り上げたベストプラクティスと実践的ガイドラインを紹介します。AWS Batch で Amazon EC2 スポットインスタンスを使う事でコスト面での最適化をする方法や、問題が発生した場合どのように対応すれば良いのか、コンテナを利用した大規模な構成を学ぶことができるでしょう。

Read More

Docker Compose を使用した Docker Swarm から Amazon ECS への移行

この記事は Migrating from Docker Swarm to Amazon ECS with Docker Compose を翻訳したものです。 Introduction Docker Compose for Amazon Elastic Container Services (Amazon ECS) を活用することで、Compose ファイルで定義されたアプリケーションを Amazon ECS にデプロイすることができます。Compose はインフラストラクチャやクラウドサービスに依存しないオープンな仕様であり、開発者は開発時に一度アプリケーションを定義するだけで、本番環境に至るまで同じ定義をワークロード上で使用することができます。Compose は何年も前から存在しており、すでに多くの組織がワークロードをローカルマシンや Docker Swarm にデプロイするために活用しています。 この記事では、Docker Swarm から Amazon ECS への移行ツールとして Compose を使用することで、Compose の柔軟性を示します。これを行うために、既存の Compose ファイルを使用して Docker Swarm にアプリケーションをデプロイしていく予定です。次に、Docker Compose for Amazon ECS を活用することで、同じ Compose ファイルを使用して、Docker CLI のデプロイメントコンテキストを変更し、同じワークロードを […]

Read More

Amazon Managed Service for Prometheus を使用して EC2 環境を監視する

2021年4月16日追記:この記事は、Prometheus サーバーでの AWS Signature Version 4 サポート によって導入された変更を反映するように更新されました。 先日、Prometheus メトリクスの取り込み、クエリ、保存を行うフルマネージドでセキュアな Prometheus 互換環境を作成できるAmazon Managed Service for Prometheus (AMP) を発表しました。AWS Management & Governance の以前のブログ記事で、コンテナ化された環境を監視するためにAMPをセットアップする方法を説明しました。いくつかのクリティカルなユースケースでは、コンテナ化はずっと先のことだったり、時には不可能な場合があります。 この記事では、Amazon Elastic Compute Cloud (Amazon EC2) またはオンプレミス環境で稼働しているシステムでどのように AMP を使うのかを説明します。

Read More

Amazon ECS/EKS関連の日本語ハンズオンのご案内 2021年10月版

みなさん、こんにちは。ソリューションアーキテクト、コンテナスペシャリストの荒木です。 今日は、「Amazon Elastic Container Service (Amazon ECS、ECS) のハンズオン資料はありませんか?」というリクエストにお答えしてご案内します。あわせて、Amazon Elastic Kubernetes Service (Amazon EKS、EKS) についてもご案内します。 様々な業種のお客様とAWSの利用についてお話しさせてもらう機会がありますが、利用する技術をどのように身につけるのかがしばしば話題になります。もちろんコンテナコンピューティング(以下コンテナ)についてもご相談をいただくことがありますが、コンテナ技術はまだまだ発展の途中にあり、歴史的に確立されたラーニングパスがありません。

Read More

Amazon OpenSearch Serviceを利用したVMware Cloud on AWSワークロードのモニタリング

2021年9月8日:Amazon Elasticsearch ServiceはAmazon OpenSearch Serviceに名称変更されました。詳細を確認する。 AWSでSpecialist Solutions Architectを務めるDrew Rutledgeによる記事です。 VMware Cloud on AWSは、VMwareとAWSが共同で開発したソリューションで、vSphere、NSX、vSANなどのVMwareのSoftware-Defined Data Center (SDDC) テクノロジーをAWSグローバルインフラストラクチャ上で提供します。 Amazon OpenSearch Service (Amazon Elasticsearch Serviceの後継サービス) を利用すると、インタラクティブなログ分析、リアルタイムのアプリケーションモニタリング、ウェブサイト検索などを簡単に実行できます。Amazon OpenSearch Serviceは、Elasticsearchから派生した、分散型のオープンソース検索および分析スイートです。

Read More

【開催報告】「 Amazon EC2 大活用 ~ 最新ラインナップ、コストパフォーマンス最適化、先進顧客事例などご紹介~」セミナー

ソリューションアーキテクトの松尾です。2021年10月14日に「Amazon EC2 大活用 ~ 最新ラインナップ、コストパフォーマンス最適化、先進顧客事例などご紹介~」をオンライン開催しました。当日は200名超のお客様にご参加いただき、Amazon EC2の歴史、Amazon EC2最新情報、機械学習用インスタンスについて、AWSから発表し、さらに、Graviton2インスタンスご利用事例、Inf1インスタンスご利用事例を、2社のお客様からご発表いただきました。 本記事では、発表内容の概要と、発表資料のご紹介に加え、当日のQ&Aについても記載します。

Read More

SAP認定Amazon EC2 M6iインスタンスがご利用可能です

本記事はAWSのSAP/VMware担当ゼネラル・マネージャーであるスティーブン・ジョーンズと、Intelのクラウド&エンタープライズ・ソリューション・グループ担当ゼネラル・マネージャーであるアヌラグ・ハンダが共同で執筆しました。 Amazon EC2 M6iインスタンスの優れたパフォーマンスをミッションクリティカルなSAPワークロードでご利用可能に AWSとIntelは、SAP NetWeaverのワークロードに対応した新しいAmazon EC2 M6iインスタンスを発表しました。これは、SAP note 1656099に記載されている通り、第3世代のIntel® Xeon® スケーラブル・プロセッサーを搭載した、初めて一般提供されるSAP認定のクラウドインスタンスです。

Read More

Amazon EKS で GitOps パイプラインを構築する

この記事は Building a GitOps pipeline with Amazon EKS (記事公開日: 2020 年 12 月 3 日) を翻訳したものです。 本記事は Weaveworks のコンテンツディレクターの Anita Buehrle による寄稿記事です。 このシリーズの第 1 部では、GitOps の歴史、その利点、およびその仕組みについて議論しました。GitOps とは何であるかを理解したので、アプリケーションのデプロイに Flux と Amazon EKS を使用して GitOps パイプラインを設定する方法について詳しく説明します。

Read More