AWS Startup ブログ

【セッション紹介】re:Cap for startups シリーズ / AWS Summit Online 2021

5万人の技術者およびビジネス関係者が参加する日本最大の AWS イベント「AWS Summit Online 2021」が、2021年5月11日・12日に開催されました。本記事では基調講演やセッションのなかから、スタートアップに関連するものをご紹介します。

今回ピックアップするのは「re:Cap for startups シリーズ」です。

re:Cap for startups シリーズでは、リソース(時間)の限られたスタートアップのお客様に AWS の最新情報を効率的に学んで頂けるよう、スタートアップ専任のソリューションアーキテクトが最新情報を厳選してお伝えしています。

 

re:Cap for startups – AI/ML / 針原 佳貴

最初に、機械学習関連のワークロードを専門としているスタートアップソリューションアーキテクト針原 佳貴 (@_hariby) によるセッション「re:Cap for startups – AI/ML」の内容をお伝えします。セッション前半では、機械学習の始め方や AWS の AI/ML サービスの全体像が解説されました。

その後、近年に発表された AI/ML 関連のアップデートが紹介されました。まずは新サービスの Amazon Lookout for Metrics。機械学習の技術を応用してつくられた、ビジネス上のメトリクスの異常値を検出できるサービスです。機械学習の知識がない方でも、高精度な異常検知を簡単に利用可能です。

もう1つ新サービスの Amazon DevOps Guru。機械学習によりアプリケーション運用上の問題点や改善すべき点を可視化し、可用性の向上に寄与するサービスです。Amazon.com と AWS が長年の運用経験で培ってきた機械学習の知見を用いて作成されています。

また、Amazon CodeGuru の機能アップデートもありました。Amazon CodeGuru Reviewer と Amazon CodeGuru Profiler は従来 Java のみを対象としていましたが、新しく Python のサポートを開始しました(なお Python サポートはプレビュー中であるため、こちらの機能を前提とした本番環境の整備はおすすめしておりません)。

Amazon SageMaker にも複数のアップデートがありました。SageMaker は機械学習を行う上で必要となる各フェイズのタスクを簡単に AWS 上で実現できるマネージドサービスで、大きく分けて「PREPARE」「BUILD」「TRAIN & TUNE」「DEPLOY & MANAGE」の4フェイズをカバーしています。

「PREPARE」としては以下の機能が新しく追加されました。

SageMaker Data Wrangler … 迅速かつ容易に機械学習のためのデータを準備できる。
SageMaker Feature Store … 機械学習の学習・推論に必要な Feature を保存・更新・取得・共有可能にする専用リポジトリ。
SageMaker Clarify … 機械学習によるバイアスを防ぐために、機械学習の各プロセスにおけるデータ・モデルの不均衡の検出を行う。

「BUILD」としては、一般的な機械学習のユースケース向けの各種ソリューションの提供や、オープンソースのモデルを簡単にデプロイ・ファインチューニングできる SageMaker JumpStart が追加されました。

「TRAIN & TUNE」としては、効率的な分散学習を実装できる、モデル並列・データ並列のライブラリが新登場。さらに、機械学習モデルのデバッグができる SageMaker Debugger には、学習時のハードウェアリソースを有効活用するためのプロファイリング機能が追加されました。

「DEPLOY & MANAGE」では、Edge デバイスへのモデルのデプロイを管理する SageMaker Edge Manager や、機械学習の CI/CD パイプラインをシンプルに構築できる SageMaker Pipelines といった機能も登場しています。

セッション終盤では AWS で使える深層学習向けのアクセラレータとして以下が紹介されました。

その他のアップデートとして、Amazon EKS が EFAP4d インスタンスをサポートしたことや、P4d インスタンスが東京リージョンでも利用可能になったことも紹介。「AWS の各種 AI/ML サービスを有効活用してください」と視聴者に呼びかけ、セッションを終了しました。

 

re:Cap for startups – Analytics / Torgayev Tamirlan

続いては、スタートアップソリューションアーキテクトの Torgayev Tamirlan (@prog893) によるセッション「re:Cap for startups – Analytics」の内容をお伝えします。

まずは、スタートアップにおいて「なぜデータを収集する必要があるのか」という前提について説明しました。スタートアップの限られたリソースを効率良く使うには、データドリブンな意思決定が必要不可欠です。また、AI/ML によって他社との差別化を行うには、多くのトレーニングデータを用意する必要があります。

そのため、ビジネスの競争力を獲得するためには、データを収集・活用しやすい環境を整えることが重要なのです。データを一つのところに集め、一元管理し、各データ分析サービスで利用する具体例として、レイクハウスアーキテクチャが挙げられます。

しかし、レイクハウスアーキテクチャを実現するには、いくつか乗り換えるべき課題があります。まず、複数のデータソースを跨ぐデータ分析が求められるケースがあること。また、データソース間でデータを移動したうえで、移動先で分析を行うことが求められるケースもあります。

これらの課題を解決する方法として有効な、新しく登場した AWS のサービスや機能について、順に紹介していきました。まず、Amazon Redshift と他のデータベース間でデータ連携できる Amazon Redshift Federated Queries が、新しく RDS/Aurora MySQL をサポートしました(現在はプレビュー版)。また、新機能として Amazon Athena Federated Queries も登場しています。これは、リレーショナル、非リレーショナル、オブジェクトなど多種多様なデータソースに格納されているデータに対して、SQL クエリを実行できる機能です。

また、データソース間でデータを移動して移動先で分析を行うには、AWS Lake Formation が有効であることも紹介。AWS Lake Formation を使ってデータレイクを構築することで、すべてのデータを1か所に集めて分析に活用することが可能になります。

しかし、AWS Lake Formation を活用するうえで「RDBMS で行われたデータの更新・削除をデータレイクにも反映させたい場合、トランザクションレベル同期をどう実現すればいいか」という点を考慮する必要があります。その課題を解決するのが、新機能である AWS Lake Formation Governed Tables です(現在はプレビュー版のため本番環境での利用は推奨しておりません)。

AWS Lake Formation Governed Tables は ACID トランザクションに対応しており、元データが Amazon S3 の Bucket に残ったままになるためロックインがありません。さらに、Apache Hudi・Delta Lake・Apache Iceburg のインポート・エクスポートの対応や、特定時点のデータを分析するタイムトラベル機能が搭載されているなど、数多くの利点があります。

さらに、AWS Glue Elastic Views という新機能もデータ分析には有効です(現在はプレビュー版)。SQL を用いて複数のデータストアにあるデータを結合・集約させ、マテリアライズドビューを作成できます。

セッション終盤では、ETL パイプラインにおける結果整合性の問題を解決する方法や、開発コストを抑える方法についても解説されました。書き込み後の読み取り整合性を実現する Amazon S3 Strong Read-after-Write Consistency や、コードを書かずにデータ前処理を作成・実行する AWS Glue DataBrew などの新機能が有効であることが語られ、セッションは終了しました。

 

re:Cap for startups – Containers/Serverless + α / 野口 真吾

スタートアップソリューションアーキテクトの野口 真吾 (@nog) は「re:Cap for startups – Containers/Serverless + α」と題したセッションで、コンテナやサーバーレスに関する機能のアップデートを中心に紹介しました。

まずはコンテナに関して。AWS Copilot の一般利用が開始しました。AWS Copilot は Amazon ECS CLI の後継にあたるツールです。AWS Copilot と Dockerfile を用意するだけで、ユーザーはコンテナのビルドやイメージの push、Amazon ECS 上にあるコンテナの起動などを簡単に実現できます。

次に、Amazon ECS Exec によるコンテナへのアクセスがサポートされました。こちらは、AWS が発表しているコンテナロードマップのなかでも、最もリクエストが多かった機能になります。Amazon ECS(on EC2、on Fargate)上にあるコンテナに対して、単一のコマンドや対話型のシェルを実行可能です。

Amazon ECS に関する他のアップデートとして、Amazon ECS Deployment Circuit Breaker の一般提供も開始されました。Amazon ECS のローリングアップデートでデプロイ後にサービスが異常状態だと判定された場合に、自動的なロールバックが可能になりました

また、Amazon Lightsail においてコンテナが利用可能になりました。Amazon Lightsail でコンテナをデプロイする場合、ユーザーが用意するのはコンテナイメージのみです。IAM ロールなどの権限管理や各種インフラ管理を行う必要はありません。

他には AWS Batch が AWS Fargate のサポートを開始しました。AWS Batch はキューにジョブを登録すると、必要なリソースを準備してバッチ処理を行うサービスです。AWS Fargate 対応により、Amazon EC2 の起動時間などを意識せず、AWS Batch を実行可能になりました。

続いて、サーバレス関連のアップデートを紹介します。まずは、AWS Lambda がコンテナイメージのデプロイに対応しました。ユーザーは Amazon ECR にコンテナイメージを登録し、AWS Lambda 側で Amazon ECR のイメージタグまたはリポジトリのダイジェストを指定することで、デプロイを実施できます。

さらに、AWS Lambda で利用可能なリソースの上限が緩和されました。指定可能なメモリの最大値が 3GB から 10GB に増加しています。AWS Lambda はメモリ容量と CPU リソースが紐づいているため、この変更によって最大 6vCPU まで利用可能になりました。

AWS Lambda は利用料金が最適化されるアップデートもありました。課金単位がより高精度になり、従来の 100ms 単位から 1ms 単位に変更されています。実行時間の短い処理の場合、コスト削減の効果が特に顕著になります。

その他のアップデートとして、以下の要素が挙げられました。

  • Amazon API Gateway の HTTP API が AWS Step Functions との連携を強化し、Synchronous Express Workflow を同期的に呼び出せるようになりました。
  • AWS Amplify の関連機能として、画面から各種データを管理できる AWS Amplify Admin UI が登場しました。
  • Application Load Balancer が gRPC プロトコルをサポートしました。
  • オブジェクトストレージの使用状況とアクティビティの状況を可視化する Amazon S3 Storage Lens が登場しました。
  • Amazon S3 Intelligent Tiering にアーカイブアクセス階層が追加されました。
  • AWS Compute Optimizer が EBS ボリュームをサポートしました。
  • Amazon EC2 上で Mac OS のインスタンスを扱える Mac1 Instances が登場しました。
  • 従来の AWS Graviton プロセッサよりも性能が大幅に向上した AWS Graviton2 プロセッサが登場しました。

 

おわりに

re:Cap for startups シリーズでは厳選された最新情報が紹介されました。スタートアップの事業運営においては、人・物・金・時間などのリソースが限られているなかで、最大限の成果を出すことが求められます。

自社のプロダクトに適した AWS のサービスや機能を学んでおくことで、適切なアーキテクチャを構築でき、より少ないコストでより大きな成果を出せるのです。だからこそ、各セッションで語られたアップデート情報を知ることには意義があります。

セッション内で紹介された知見や AWS の各種サービスをご活用いただき、みなさんの事業成長やプロダクト開発にお役立てください。