Amazon Web Services ブログ

Category: Artificial Intelligence

ブンデスリーガマッチファクト xGoals を支える技術: 機械学習がサッカーのデータ駆動型の洞察をどのように推進しているか

サッカーの試合を観戦していて、プレイヤーがゴールを決めたのを見たとき、そのゴールを決めるのがいかに難しかったかを想像してみることがよくあります。テレビで試合を見ていて、そのシュートがゴールネットを揺らすのがいかに難しかったかを放送席が叫ぶのを聞くと、自分の考えは正しかったのだと確認できるかもしれません。以前は肉眼で視て、ゴールキーパーの周囲にいたディフェンダーの数や、プレイヤーがゴールネットの正面にいたか、側面にいたかの立ち位置に基づいた仮定で脚色していました。今では、AWS によるドイツのブンデスリーガのマッチファクト (試合詳報) サービスの 1 つである xGoals (「Expected Goals」の略) を使って、感嘆の叫びをデータと洞察で補強することができるようになりました。これにより、プレーヤーが競技場のあらゆる位置からシュートするときにゴールを決める正確な確率をファンに示すことができます。 Deutsche Fußball Liga (DFL) は、ドイツのプロサッカーリーグ、ブンデスリーガおよびブンデスリーガ 2 部 の組織の編成とマーケティングを担当しています。すべての試合で、DFL は 360 万以上のデータポイントを収集して、競技場で起こっていることについてのより深い洞察を得ています。思い描いているビジョンは、世界中の 5 億人を超えるブンデスリーガファンと 70 を超えるメディアパートナーの体験を強化することにより、最も革新的なスポーツリーグになることです。DFL は、テクノロジーを新しい方法で使用して、機械学習 (ML) で駆動されるリアルタイムの統計を提供し、パーソナライズされたコンテンツをファンのために作成し、データを洞察と行動に変えることで、そのビジョンの実現を目指しています。 xGoals は、DFL と AWS が 2020 年 5 月の終わりに正式に開始した 2 つの新しいマッチファクト (平均順位は 2 番目) の 1 つで、ドイツのブンデスリーガとのグローバルなファンエンゲージメントを強化しています。ブンデスリーガはドイツ国内のサッカーリーグの最高峰で、試合ごとの平均ゴール数が最も多いリーグです。xGoals は、ML モデルを構築、トレーニング、デプロイするフルマネージドサービスである Amazon SageMaker を使用して、ブンデスリーガプレイヤーが競技場の任意の位置からシュートしてゴールを決める可能性を客観的に評価できます。 xGoals はまた、プレイヤーがパスを出すことで、シュートを打ったり良い位置取りをしている他のプレイヤーにパスを出したりするよりも得点機会が高まったかを判断できます。 xGoals や他のブンデスリーガのマッチファクトは、サッカーの世界にデータ駆動型の洞察を提供することで、新しいスタンダードを打ち立てています。 ゴールスコアリングの可能性の定量化 […]

Read More

オープンソース Amazon SageMaker XGBoost アルゴリズムコンテナのご紹介

XGBoost は、表形式データセットでの回帰タスクと分類タスクの実行によく使用される効率的な機械学習 (ML) アルゴリズムです。このアルゴリズムはツリーに勾配ブースティングと呼ばれる技法を実装し、ML 大会で極めて優れた成績を残しています。 Amazon SageMaker は、提供開始時から XGBoost を組み込みのマネージドアルゴリズムとしてサポートしてきました。詳細については、XGBoost と Amazon SageMaker を使った機械学習の簡素化を参照してください。この記事を書いている時点で、より優れた柔軟性、スケーラビリティ、拡張性、およびマネージドスポットトレーニングを備えたオープンソース Amazon SageMaker XGBoost コンテナを活用することが可能です。詳細については、GitHub で Amazon SageMaker サンプルノートブックと sagemaker-xgboost-container を参照、または「Xboost アルゴリズム」をお読みください。 この記事では、オープンソース XGBoost アルゴリズムコンテナのメリットと、3 つのユースケースをご紹介します。 オープンソース SageMaker XGBoost コンテナのメリット 新しい XGBoost コンテナには、以下のメリットがあります。 最新バージョン オープンソース XGBoost コンテナは、最新の XGBoost 1.0 リリースと、マルチコアインスタンスでのより高機能なスケーリング、および分散型トレーニングのための優れた安定性を含めたすべての改善点をサポートしています。 柔軟性 新しいスクリプトモードによって、独自のトレーニングスクリプトをカスタマイズまたは使用することができるようになりました。TensorFlow、MXNet、PyTorch、および Chainer のユーザーも利用できるこの機能は、カスタマイズされたプリプロセスまたはポストプロセスロジックの追加、トレーニングプロセス後の追加ステップの実行、すべての XGBoost 機能 (交差検証のサポートなど) の活用を可能にします。他の Amazon SageMaker 組み込みアルゴリズムといった非スクリプトアルゴリズムモードも引き続き使用できます。このモードでは、データの場所とハイパーパラメータの指定のみが必要です。 スケーラビリティ […]

Read More

Amazon SageMaker Ground Truth と Amazon Comprehend を使用しての NER モデルの開発

固有表現抽出 (NER) とは、テキストデータを選別して固有表現と呼ばれる名詞句を特定し、「人」「組織」「ブランド」などのラベルによってそれぞれを分類する処理のことです。たとえば「私は最近 Amazon プライムに登録した」というテキストにおいては、「Amazon プライム」が固有表現であり「ブランド」として分類可能です。自社内において、精密な表現抽出機能を構築することは手の込んだ作業になり得ます。これには、手動で注釈付けをしたトレーニングドキュメントをいくつも用意することや、モデルトレーニング用に適切なアルゴリズムとパラメータを選択することが求められます。 今回の記事では、カスタム NER モデルを構築するための、Amazon SageMaker Ground Truth と Amazon Comprehend を使用するエンドツーエンドのパイプラインを取り上げていきます。 Amazon SageMaker Ground Truth を使用すると、機械学習システムのトレーニングに必要なデータセットを、効率的かつ正確にラベル付けすることが可能になります。Ground Truth には、ラベル付けをする人間にそのタスクをステップバイステップで示してくれる、ラベル付けワークフローが組み込まれています。さらに、機械学習 (ML) システムのトレーニングに必要とされる注釈付きの NER データセットを効率よく、正確に構築するためのツールも提供されています。 Amazon Comprehend は、機械学習を使用してテキストに関するインサイトやその内部の関係性を抽出できる、自然言語処理 (NLP) サービスです。Amazon Comprehend では、UTF–8 形式であれば任意のテキストファイルを処理できます。ドキュメント内にある、表現、主要なフレーズ、言い回し、感情、および他の一般的な要素を認識することで、インサイトを生成します。カスタムの表現抽出サービスを使用するには、モデルトレーニングのためのデータセットを作成する必要があります。そのためには、注釈がつけられた一連のドキュメントを使用するか、表現とそのタイプ (例: PERSON) を記載したリストに加え対象となる表現を含むドキュメントを用意します。このサービスは、モデルのトレーニングに使用する、アルゴリズムとパラメータにおける最良かつ最も精度の高い組合せを得るための、自動的なテストを実施します。 次の図は、このソリューションのアーキテクチャを示しています。 ここでのエンドツーエンドのプロセスは次のとおりです。 Amazon Simple Storage Service (Amazon S3) に一連のテキストファイルをアップロードします。 Ground Truth 内に、非公開のワークチームと、NER 用のラベル付けジョブを作成します。 非公開ワークチームがすべてのテキストドキュメントに対しラベル付けを行います。 上記が完了すると、Ground Truth は […]

Read More

S+Camera と Amazon Rekognition を組み合わせて来客分析を行う

本記事では、IoT@Loft #9 で ソラコム様にご紹介いただいた、S+Camera Basic (以下 S+Camera) と Amazon Rekognition や Amazon Elasticsearch Service などを組み合わせたデモを実現する方法を説明します。このデモでは、店舗の入り口に設置した S+Camera で顔を検出、検出した顔を Amazon S3 にアップロード、Amazon Rekognition を用いて分析することで、顧客の年齢や性別などの分析や、お得意様来店時の通知などを行うことができます。 Amazon Rekognition では、機械学習の専門知識を必要とせずに、実績のある高度にスケーラブルな深層学習テクノロジーを使用して、アプリケーションに画像およびビデオ分析を簡単に追加できるようになります。Amazon Rekognition を使用すると、画像と動画の物体、人物、テキスト、シーン、活動を特定し、不適切なコンテンツを検出できます。また、Amazon Rekognition カスタムラベルを使用することで、ビジネスニーズに合わせた画像の物体やシーンを特定できます。

Read More

AWS DeepComposer で AR-CNN アルゴリズムを使用してバッハのスタイルで楽曲を生成する

AWS DeepComposer は、機械学習 (ML) と生成 AI 技術を開始するためのクリエイティブな方法を提供します。AWS DeepComposer は最近、自己回帰畳み込みニューラルネットワーク (AR-CNN) と呼ばれる新しい生成 AI アルゴリズムの提供を開始しました。これは、バッハスタイルの音楽の生成を可能にします。このブログ投稿では、AR-CNN アルゴリズムを使用してバッハスタイルの興味深い楽曲を生成する方法の例をいくつか示すとともに、アルゴリズムのパラメータが生成される楽曲の特性にどのように影響するのかを説明します。 AWS DeepComposer コンソールで提供される AR-CNN アルゴリズムは、ユニークな楽曲を生成するために、反復する回数や、入力メロディに追加したり、入力メロディから削除したりする音の最大数などのさまざまなパラメータを提供します。パラメータ値は、入力メロディが変化する範囲に直接影響を与えます。例えば、追加する音の最大数として大きな値を設定することで、アルゴリズムは、バッハの音楽スタイルの楽曲に適していると予測する音を追加することができます。 AR-CNN アルゴリズムを使用すると、パラメータを試すことにより、機械学習アルゴリズムと繰り返し共同作業を行うことができます。AR-CNN アルゴリズムの 1 つの反復の出力を次の反復の入力として使用できます。 アルゴリズムの概念の詳細については、AWS DeepComposer コンソールで利用可能な Introduction to autoregressive convolutional neural network の学習カプセルを参照してください。学習カプセルでは、生成 AI アルゴリズムの概念を学ぶのに役立つ、理解しやすい簡単なコンテンツを提供しています。 バッハは、史上最高の作曲家の 1 人として広く認知されています。バッハの楽曲の数々は、バロック時代における最高傑作です。バッハの楽曲のサンプルをいくつか聴いて、彼の音楽に耳を慣らしましょう。 楽曲 1: 楽曲 2: 楽曲 3: AR-CNN アルゴリズムは、入力メロディに音を追加または削除することにより、元の入力メロディを強化します。アルゴリズムがキー外の音や無関係な音を検出した場合、削除を選択することがあります。バッハの楽曲に用いられている可能性が高い特定の音をアルゴリズムが識別した場合、これらの音を追加することがあります。AR-CNN アルゴリズムを適用して生成した、以下の強化された楽曲のサンプルを聴いてみましょう。 入力: 強化された楽曲: AR-CNN アルゴリズムパラメータの値を変更して、さまざまな特性を持つ音楽を生成できます。 AWS DeepComposer の […]

Read More

AWS Transcribe と IoT デバイスを使用して、他言語の音声をテキストに変換して通知するシステムを構築する

留守中のご自宅で訪問者のメッセージを残したいと思ったことはありませんか? もしそのソリューションが他言語をサポートできるとしたらどうでしょうか? このソリューションは、簡単に構築でき、使用した分だけ支払うことができるので費用対効果が高いです。 この投稿では、人を感知し、音声を録音し、音声をテキストに変換し、優先言語のテキストをモバイルデバイスに送信する通知システムを構築する方法を説明します。このソリューションでは、以下のサービスを利用しています。 AWS CloudFormation AWS Lambda Amazon Polly Amazon Simple Notification Service (Amazon SNS) Amazon Simple Storage Service (Amazon S3) Amazon Transcribe 前提条件 このチュートリアルを完了するには、次の前提条件を満たしている必要があります。 Noobs が実行している Raspberry Pi 4 デバイス Raspberry Pi に接続した超音波センサー マイク スピーカー AWS アカウント ワークフローとアーキテクチャ センサーが指定された範囲内にいる人を感知すると、Raspberry Pi に接続されているスピーカーで、最初の挨拶とメッセージ録音の指示を伝えます。この録音は Amazon S3 に送信されます。これにより、Lambda 関数がトリガーされ、Amazon Transcribe が音声をテキストに書き起こします。テキストの書き起こしが完了すると、ユーザーは Amazon SNS から書き起こしたテキストの通知を受け取ります。 次の図は、ソリューションのワークフローを示しています。 Amazon Transcribe […]

Read More

【開催報告】AWS AI/ML@Tokyo #4

アマゾン ウェブ サービス ジャパン株式会社 機械学習ソリューションアーキテクトの上総 (Twitter: @tkazusa) です。AWS Japan 目黒オフィスでは、今年からAI/ML関連情報を発信するイベント「AWS AI/ML@Tokyo」を定期的に開催しています。2020年6月11日にオンラインで開催された AWS AI/ML@Tokyo #4 では、AWS Japan による最新のAI/MLサービスアップデートとその利用用途のご紹介と、お客様活用事例として、Amazon Personalizeの活用事例をお話しいただきました。

Read More

Amazon Kendra を使用してエンタープライズ検索を強化する

Amazon Kendra は使いやすいエンタープライズ検索サービスです。これにより、アプリケーションに検索機能を追加して、エンドユーザーが社内のさまざまなデータソースに保存されている情報を簡単に見つけることができます。これには、請求書、ビジネス文書、技術マニュアル、販売レポート、企業用語集、社内ウェブサイトなどが含まれます。この情報は、Amazon Simple Storage Service (Amazon S3) や OneDrive などのストレージソリューション、SalesForce、SharePoint、Service Now などのアプリケーション、または Amazon Relational Database Service (Amazon RDS) などのリレーショナルデータベースから収集できます。 質問を入力すると、サービスは機械学習 (ML) アルゴリズムを使用してコンテキストを理解し、正確な回答であろうとドキュメント全体であろうと、最も関連性の高い結果を返します。最も重要なのは、これを行うために ML を使った経験を必要としない点です。AmazonKendra は、新規または既存のアプリケーションと簡単に統合するために必要なコードも提供します。 この記事では、Amazon Kendra の機能を使用して内部エンタープライズ検索を作成する方法を示します。これにより、独自の検索インデックスを作成してクエリを実行するソリューションを構築できます。この記事では、データソースとして HTML 形式の Amazon.com ヘルプドキュメントを使用していますが、Amazon Kendra は MS Office (.doc、.ppt)、PDF、およびテキスト形式もサポートしています。 ソリューションの概要 この記事では、Amazon Kendra を使用して AWS でエンタープライズ検索エンジンを作成するのに役立つ手順を示します。詳細な技術的知識や ML の経験がほとんどなくても、新しい Amazon Kendra インデックスを 1 時間以内にプロビジョニングできます。 この記事では、FAQ の追加、カスタムアプリケーションへの Amazon Kendra […]

Read More

MLOps を適用して、Amazon Forecast で AI を利用した予測の自動化を構築する

この投稿では、Amazon Forecast で構築された予測モデルを開発して視覚化するために、サーバーレス Machine Learning Operations (MLOps) パイプラインを作成する方法を示します。Machine Learning (ML) のワークロードはスケーリングする必要があるため、ビジネス価値を得るために、さまざまな利害関係者間のサイロを取り除くことが重要です。MLOps モデルにより、データサイエンス、プロダクション、および運用の各チームが、可能な限り自動化されたワークフロー全体でシームレスに連携することができ、スムーズなデプロイと効果的かつ継続的なモニタリングが確実に行われるようにします。 ソフトウェア開発の DevOps モデルと同様に、ML の MLOps モデルは、ML ツールとフレームワーク全体におけるコードの構築と統合をサポートします。カスタムコードを書き直したり、既存のインフラストラクチャを再考したりすることなく、データパイプラインを自動化、運用、およびモニタリングできます。MLOps は、既存の分散ストレージと処理インフラストラクチャをスケーリングして、ML モデルを大規模にデプロイして管理するのに役立ちます。また、組織全体のすべてのモデルのドリフトを、一元化された場所で経時的に追跡および視覚化して、自動データ検証ポリシーを実装することもできます。 MLOps は、継続的な統合、継続的なデプロイ、および継続的なトレーニングを適用することにより、DevOps と ML の世界のベストプラクティスを組み合わせています。MLOps は、本番環境における ML ソリューションのライフサイクルを合理化するのに役立ちます。詳細については、Machine Learning Lens: AWS Well-Architected Framework と題したホワイトペーパーを参照してください。 以降のセクションでは、Amazon Forecast、AWS Lambda、およびAWS Step Functions を含む MLOps パイプラインを活用して、時系列予測モデルを構築、トレーニング、およびデプロイします。生成された予測を視覚化するには、Amazon Athena や Amazon QuickSight などの AWS サーバーレス分析サービスの組み合わせを使用します。 ソリューションのアーキテクチャ このセクションでは、Amazon Forecast の使用とデプロイを自動化するための青写真として使用できる MLOps […]

Read More

AWS DeepComposer Chartbusters: バッハスタイルで楽曲を生成し、チャートのトップを目指して競い合いましょう

AWS DeepComposer Chartbusters のリリースを発表できることを嬉しく思います。これは毎月開かれるチャレンジで、開発者が AWS DeepComposer を使ってオリジナルの楽曲を作成し、チャートのトップを勝ち取り、賞品を獲得するために競い合います。AWS DeepComposer は、開発者に機械学習 (ML) とジェネレーティブ AI 技術を始めるための創造的な方法を提供します。AWS DeepComposer では、開発者は ML のバックグラウンドに関係なく、ジェネレーティブ AI テクニックを使用開始して、モデルをトレーニングおよび最適化してオリジナルの音楽を作曲する方法を学ぶことができます。AWS DeepComposer Chartbusters の最初の課題である Bach to the Future では、開発者が AWS DeepComposer コンソールで提供される新しいジェネレーティブ AI アルゴリズムを使用して、バッハスタイルの楽曲を作成することが求められます。 AWS は毎月 2020 年 10 月まで、さまざまなジェネレーティブ AI テクニックを紹介するために毎月異なるテーマの新しい Chartbusters チャレンジをリリースします。チャレンジに参加するのに音楽の知識は必要ありません。チャレンジに参加する前に、AWS DeepComposer コンソールで利用できるラーニングカプセルを用いて、毎月のチャレンジに必要なジェネレーティブ AI の概念を学習できます。ラーニングカプセルは、ジェネレーティブ AI アルゴリズムの概念を学ぶのに役立つ、頭に入りやすい一口サイズのコンテンツを提供します。 チャレンジに参加する方法 チャレンジは、開発者が参加するために世界中で開かれています。開始するには、AWS DeepComposer コンソールで利用できるジェネレーティブ AI アルゴリズムの 1 […]

Read More