Amazon Web Services ブログ
AWS が機械学習をすべての開発者と BI アナリストの手に委ねている方法
本日、AWSは Amazon Aurora データベースのリレーショナルデータと Amazon S3 の非構造化データを使用して、機械学習 (ML) 予測をアプリケーションおよびビジネスインテリジェンス (BI) ダッシュボードに簡単に追加する新しい方法を発表しました。SQL (構造化クエリ言語) クエリにいくつかのステートメントを追加し、Amazon QuickSightで数回クリックするだけです。Aurora、Amazon Athena、および Amazon QuickSight は、Amazon SageMaker や Amazon Comprehend などの AWS ML サービスをお使いのアプリケーションから直接呼び出します。これにより、カスタム統合を構築したり、データを移動したり、別のツールを学習したり、複雑なコード行を記述したり、ML の経験を積んだりする必要なく、ML 予測をアプリケーションに簡単に追加できます。
これらの新しい変更により、洗練された ML 予測を SQL クエリとダッシュボードでより簡単に利用できるすることで、データベース開発者やビジネスアナリストがMLをより使いやすくアクセスしやすくなります。以前は、拡張して、本番環境でマネージしてサポートされる必要があるカスタムアプリケーションレベルのコードを書くのに何日も費やす可能性がありました。今では、SQL を書ける人なら誰でも、カスタムの「グルーコード」なしでアプリケーションで予測を作成して使用できます。
データにあふれた世界を理解する
AWSは、それほど遠くない将来に、ほぼすべてのアプリケーションに ML と人工知能 (AI) が使用されると固く信じています。数万人のお客様が、データサイエンティストと開発者が大規模な ML モデルを迅速かつ簡単に構築、トレーニング、デプロイできるようにするフルマネージドサービスである Amazon SageMaker を通じて ML の恩恵を受けています。
たとえば、Amazon Comprehend のような使いやすい API を介してモデルを構築し、アプリケーションにインテリジェンスを追加するさまざまな方法がありますが、これらのモデルをデータベース、分析、ビジネスインテリジェンスレポートに組み込むことは依然として難しいものになっています。比較的単純なカスタマーサービスの例を考えてみましょう。Amazon Comprehend は、テキストのセンチメントをすばやく評価できます (ポジティブかネガティブか)。私がストアのカスタマーサービスページにフィードバックを残すとします。「あなたの製品は悪臭を放っているので、私は二度と買いません!」 ストアがユーザーのフィードバックに対してセンチメント分析を実行し、すぐに私に連絡して物事を正すのは簡単です。データはデータベースで利用可能であり、ML サービスは広く利用可能です。
ただし問題は、モデルとアプリケーション間でデータを移動するための予測パイプラインの構築の難しさにあります。
開発者はこれまで、こうした予測を行い、より広範なアプリケーション、プロセス、またはアナリティクスダッシュボードに組み込むめに、大量の複雑な手動作業が必要でした。これには、データを ML モデルに送信し、アプリケーション内で使用する結果を変換する前に、異なるデータストアと場所の間でデータをコピーし、データの形式を変換すし、単調で、面倒なアプリケーションレベルのコード開発が含まれます。そのような作業はややこしく、開発者の貴重な時間を使用するのはもったいないです。さらに、データをデータストアに出し入れすることは、セキュリティとガバナンスを複雑にします。
機械学習をすべての開発者の手に委ねる
AWS の使命は明確です。機械学習をすべての開発者の手に委ねることを目指しています。これは、洗練された ML サービスで生産性を高めやすくすることで実現しています。NFL、Intuit、AstraZeneca、Celgene など、あらゆる規模のお客様は、Amazon SageMaker や Amazon Comprehend などの AWS ML サービスに依存しています。たとえば、Celgene は、毒性予測に AWS ML サービスを使用して、患者を危険にさらすことなく、潜在的な薬物の生物学的影響を仮想的に分析します。以前はトレーニングに 2 か月かかっていたモデルが、4 時間でトレーニングできるようになりました。
AWS は AI サービスおよび ML サービスの最も幅広く深いセットを提供しますが、2018 年だけで 200 を超える機械学習機能を導入しましたが、さらに多くが必要であると感じました。これらのその他の革新の中で、私たちができる最善のことの 1 つは、既存の人材が ML で生産的になることを可能にすることです。
そして、具体的には、開発者人材とビジネスアナリスト人材です。
データサイエンティストの生産性を向上させるサービスを提供していますが、はるかに幅広いアプリケーション開発者が完全にクラウドネイティブで洗練された ML サービスにアクセスできるようにすることを望んでいます。数万人のお客様が Aurora を使用しており、SQL を使用したプログラミングに精通しています。トランザクション処理を遅くすることなく革新的なデータサイエンスにアクセスできるように、このデータで ML 学習予測を実行できるようにすることが重要であると考えています。以前と同様に、Amazon SageMaker を使用してビジネスデータに対して ML モデルをトレーニングできます。さらに、Aurora または Athena を使用して 1 行の SQL で同じモデルに対して予測を実行する機能を追加できます。これにより、多くのアプリケーション開発者が ML モデルの結果にアクセスしやすくなります。
リードスコアリングは、これがどのように機能するかの良い例です。たとえば、Aurora の上に CRM システムを構築する場合、顧客関係データ、マーケティングアウトリーチ、リードなどをすべてデータベースに保存します。ウェブサイトからリードが届くと、Aurora にリードは移動し、セールスチームがリードをフォローアップして顧客に変換します。
しかし、セールスチームにとってそのプロセスをより効果的にしたい場合はどうすればよいでしょうか? リードスコアリングは予測モデルであり、セールスチームが顧客のセールスに転換する可能性が最も高いリードを優先順位付けして、生産性を高めることができるように、受け取ったリードを認定およびランク付けします。データサイエンスチーム、または AWS ML Marketplace で購入したものによって構築されたリードスコアリングモデルを取得し、それを Amazon SageMaker にデプロイしてから、モデルからの予測に基づいた優先順位によりすべてのセールスキューを順位付けします。過去とは異なり、グルーコードを書く必要はありません。
または、これらのサービスを一緒に使用して、次に最適なオファーのユースケースを提供することもできます。たとえば、お客様がコールセンターに電話して問題について苦情を申し立てる場合があります。カスタマーサービスの担当者は問題に対処し、新しい製品またはサービスを提供します。どのようにして行うのでしょうか? 担当者は、複数のビューと提案を表示する Amazon QuickSight ダッシュボードで製品の推奨事項を引き出すことができます。
最初のビューには、Aurora クエリに基づく製品の推奨事項が表示されます。クエリは、顧客プロファイル、ショッピング履歴、製品カタログを取得し、Amazon SageMaker でモデルを呼び出して製品の推奨事項を作成します。2 番目のビューは、お客様の閲覧履歴またはクリックストリームデータを S3 データレイクから取得し、Amazon SageMaker モデルを呼び出して製品の推奨事項を作成する Athena クエリです。3 番目のビューは、1 番目と 2 番目のビューから結果を取得し、Amazon SageMaker でアンサンブルモデルを呼び出し、推奨事項を作成する Amazon QuickSight クエリです。これで、お客様のさまざまなビューに基づいて、1 つのダッシュボード内ですべてのオファーを作成できます。
BI アナリスト側では、モデルから予測を取得する前に予測パイプラインを構築および管理しなければならないのはいらだたしいと顧客から定期的に聞いています。開発者は現在、モデルとアプリケーション間でデータをやり取りするためにアプリケーションレベルのコードを書くのに何日も費やしています。予測パイプラインを廃止し、代わりに Amazon QuickSight を使用してすべての ML 予測を視覚化し、レポートすることを選択できます。
アプリケーション開発者とビジネスアナリストにとって、これらの変更により、カスタム統合の構築、データの移動、個別のツールの学習、複雑なコード行の記述、ML の経験さえも必要とせずに、アプリケーションに ML 予測を追加することがより簡単になります。数日間の開発者の労力の代わりに、SQL クエリにいくつかのステートメントを追加し、Amazon QuickSight で数回クリックすることができます。
これらの方法により、より多くの開発者やデータアナリストが、博士号を必要とせずに、ML のパワーを活用できるようになります。
著者について
Matt Asay (「Ay-see」と発音) は AWS のプリンシパルであり、さまざまなオープンソースおよびビッグデータ企業で 20 年近く働いています。彼を Twitter (@mjasay) でフォローできます。