Amazon Web Services ブログ

Category: Artificial Intelligence

金融サービスにおける機械学習のベストプラクティス

本投稿は、金融サービスのお客様が AWS でエンドツーエンドの機械学習ソリューションを構築して運用化する支援をしている Stefan Natu 、Amazon SageMaker のシニア事業開発マネージャーである Kosti Vasilakakis 、アマゾン ウェブ サービス、ワールドワイド金融サービス事業開発の資本市場スペシャリストである Alvin Huang 、アマゾン ウェブ サービスのプリンシパル機械学習アーキテクチャ兼 AI/ML ソリューションアーキテクチャのシニアマネージャー であるDavid Ping の4名による寄稿を翻訳したものです。 先日、AWS は機械学習 (ML) ワークフローを構築している金融機関のためのセキュリティとモデルガバナンスに関する考慮事項の要点をまとめた新しいホワイトペーパー、金融サービスにおける機械学習のベストプラクティスを公開しました。このホワイトペーパーは、セキュリティとコンプライアンスに関する一般的な考慮事項について説明し、エンドツーエンドの例を詳しく説明するハンズオンデモとワークショップの提供を目的としています。このホワイトペーパーでは金融サービスの考慮事項に着目していますが、認証とアクセスの管理、データとモデルのセキュリティ、および ML 運用化 (MLOps) のベストプラクティスに関する情報のほとんどは、ヘルスケアなどのその他の規制対象業界にも当てはまります。 次の図にあるように、一般的な ML ワークフローには複数のステークホルダーが関与します。ワークフローを適切に制御して運用化するには、ビジネスステークホルダー、SysOps 管理者、データエンジニア、ソフトウェアエンジニア、および DevOps エンジニアを含めた複数のチームと連携する必要があります。 このホワイトペーパーでは、各チームのための考慮事項を説明すると共に、Amazon SageMaker と AWS のその他サービスを使用して ML ワークロードを構築、トレーニング、およびデプロイする方法の例と図解も提供します。具体的には、規制された環境でワークロードを実行するお客様からのフィードバックに基づいて、以下のトピックを取り上げています。 セキュアな ML 環境のプロビジョニング – これには以下が含まれます。 コンピューティングとネットワークの分離 – インターネット接続がないお客様のプライベートネットワークに Amazon SageMaker をデプロイする方法。 […]

Read More

【開催報告&資料公開】AWSの機械学習を使った画像データの業務活用セミナー

こんにちは、アマゾン ウェブ サービス ジャパン株式会社の大渕です。2020年9月2日にオンラインで開催された「AWSの機械学習を使った画像データの業務活用セミナー」では、AWS Japan による3つのセッションと、AWS の機械学習サービスを使って宿泊施設向け入退室管理システムを構築されたお客様のセッションが行われました。  

Read More

【開催報告 & 資料公開】 AI/ML@Tokyo #6 AutoGluon 開催報告

アマゾン ウェブ サービス ジャパン株式会社 機械学習ソリューションアーキテクトの宇都宮 (Twitter: @shokout) です。AWS Japan では、AI/ML 関連情報を発信するイベント「AWS AI/ML@Tokyo」を定期的に開催しています。2020年9月3日にオンラインで開催された AWS AI/ML@Tokyo #6 では、AWS ソリューションアーキテクトより、AutoGluon という AutoML を実現する OSS の概要と、AutoGluon を Amazon SageMaker 上で活用するための手法に関して解説いたしました。

Read More

Amazon SageMakerでのディープラーニング学習時における、GPUパフォーマンスチューニングのためのI/O最適化

GPUはディープラーニングの学習スピードを著しく向上させ、学習にかかる時間を数週間からほんの数時間へと短縮させる可能性があります。しかし、GPUを使用する恩恵を十分に得るためには以下の点を考慮する必要があります。 基盤となるハードウェアを十分に稼働させるためのコードの最適化 最新の高性能なライブラリとGPUドライバの使用 GPUの計算と一致する速度でデータがGPUに供給されるためのI/Oとネットワーク操作の最適化 マルチGPUもしくは分散学習の際のGPU間の通信の最適化 Amazon SageMakerは開発者とデータサイエンティストがあらゆる規模で迅速かつ簡単に機械学習(ML)モデルをビルド、学習、デプロイするためのフルマネージドサービスです。この記事では、インフラ基盤やディープラーニングフレームワークに関わらず、Amazon SageMakerでの学習時におけるGPUパフォーマンスの最適化に関して、I/Oの改善の一般的なテクニックに焦点を当てます。典型的には、I/Oの処理ルーチンを最適化するだけで、GPUを用いた学習全体で最大10倍のパフォーマンス向上がみられます。

Read More

[AWS Black Belt Online Seminar] Amazon CodeGuru 資料及び QA 公開

先日 (2020/08/04) 開催しました AWS Black Belt Online Seminar「Amazon CodeGuru」の資料を公開しました。当日、参加者の皆様から頂いた QA の一部についても共有しております。 20200804 AWS Black Belt Online Seminar Amazon CodeGuru from Amazon Web Services Japan AWS クラウドサービス活用資料集(すべての過去資料が閲覧できます) Q. P27 において、AWS CodeCommit でリポジトリを作成する時に CodeGuru Reviewer を有効化することもできれば、後から有効化もできるとのことですが、有効化された時点以降のものしか反映されないのでしょうか? A. はい、既存リポジトリにて CodeGuru Reviewer を有効化した場合、Pull Request ベースのコードレビューに関しましては有効化された以降の Pull Request 内の差分のみをレビューする形となっております。なお、BlackBelt Online Seminar を実施した翌日に、Full Repository Scan の機能が公開となりました。次のご質問で詳しく紹介します。 Q. CodeGuru Reviewer についてですが、新規変更点だけでなく、既存のコードの検査をしてみたいのですが、Pull Request […]

Read More

創薬ワークフローハンズオン~ Amazon Comprehend Medicalを利用したSNS/論文分析~

創薬研究において、クラウドリソースの活用は有用です。例えば、大規模計算に必要なHPC環境を必要な時に瞬時に立ち上げて処理したり、目視による画像分類・判別を機械学習により自動化する事で、従来多くの時間がかかっていた業務を短縮することができ、創薬プロセスを飛躍的に効率化することが可能です。しかしながら、クラウドのサービスやソリューションが業務にフィットするか検証するために、計算環境や機械学習環境を構築するには手間と時間がかかります。そのため、ヘルスケア・ライフサイエンスチームでは、創薬ワークフローに対するハンズオンといった業界特化のソリューションを提供することで、機能やソリューションが業務にフィットするかユーザの方々に体感頂いております(例えば、「化合物の溶解度予測」の内容はこちらに記載しています)。今回、当該ハンズオンに対してご要望の多かった、「AWS CloudFormation (以下、CFn)によるテンプレート化」を2つのハンズオンコンテンツで実装し、数回のクリックだけでご自身の環境にDeployできるようにしました。これにより、幅広いユーザーの方に利用頂き、ソリューションを体感頂ければと思います。

Read More

Amazon Translate が Office ドキュメントのサポートを開始

  組織が多くの国で展開する多国籍企業であろうと、グローバルな成功を渇望している小さな新興企業であろうと、コンテンツを現地の言語に翻訳する課題にいつまでも悩まされることがあります。実際、テキストデータには多くの形式があり、それらを処理するにはさまざまなツールが必要になる場合があります。また、これらのツールはすべて同じ言語ペアをサポートしていない場合があるため、特定のドキュメントを中間形式に変換するか、手動翻訳に頼らざるを得ないこともあります。このような問題はすべて追加のコストを発生させ、一貫性のある自動翻訳ワークフローを構築することが不必要に複雑になってしまいます。 Amazon Translate は、こういった問題をシンプルで費用効果の高い方法で解決することを目指しています。Amazon Translate は、AWS コンソールまたは 1 回の API 呼び出しのいずれかを使用して、AWS のお客様が苦労することなくテキストを 55 の異なる言語と変異形に迅速かつ正確に翻訳できるようにします。 今年前半、Amazon Translate は、プレーンテキストと HTML ドキュメント用のバッチ翻訳を導入しました。本日、バッチ翻訳が Office Open XML 標準で定義されている Office ドキュメント、つまり、.docx、.xlsx、および .pptx ファイルもサポートするようになったことを発表します。 Office ドキュメント向けの Amazon Translate のご紹介 プロセスは非常に簡単です。ご想像のとおり、ソースドキュメントは Amazon Simple Storage Service (S3) バケットに保存する必要があります。20 メガバイトを超えるドキュメントや 100 万文字を超えるドキュメントは保存できません。 各バッチ翻訳ジョブは、単一のファイルタイプと単一のソース言語を処理します。したがって、S3 で論理的にドキュメントを整理し、各ファイルタイプと各言語に独自のプレフィックスを付けて保存することをお勧めします。 次に、AWS コンソールを使用するか、いずれかの AWS 言語 SDK で StartTextTranslationJob API を使用して、以下を渡して翻訳ジョブを起動できます。 S3 […]

Read More

Amazon Fraud Detector が一般提供されました

  発表内容 Amazon Fraud Detector が一般提供されました!🥳 2019 re:Invent での発表を逃したという皆さんのために説明すると、Amazon Fraud Detector は当初、2019 年 12 月 3 日にプレビューモードでリリースされました。その Amazon Fraud Detector が本日一般提供され、お客様にお試しいただけるようになります。 Amazon Fraud Detector とは Amazon Fraud Detector は、オンライン決済詐欺や偽のアカウントの作成など、不正行為の可能性があるオンライン活動を簡単に特定できるようにするフルマネージドサービスです。 毎年、オンライン詐欺のために世界中で数百億ドルの損害が出ていることをご存知ですか? オンラインビジネスを持つ企業は、偽のアカウントや盗まれたクレジットカードで行われた決済などの不正活動に絶えず目を光らせておく必要があります。  詐欺師を特定する試みのひとつは不正行為検出アプリの使用で、これらには機械学習 (ML) を使用するものもあります。 そこで登場するのが Amazon Fraud Detector です! これは、データ、ML、および Amazon の 20 年を超える不正検出の専門技術を用いて不正行為の可能性があるオンライン活動を自動的に識別するため、より多くの不正行為をより迅速に見つけることができます。Fraud Detector は ML に関する困難な作業のすべてを処理するため、ML 経験がなくてもほんの数クリックで不正検出モデルを作成することが可能です。 Fraud Detector の仕組み 「どんな仕組みになってるの?」と言われるかもしれません。🤷🏻‍♀️ よくぞ聞いてくださいました! では、これを […]

Read More

【開催報告】AWS AI/ML@Tokyo #5

アマゾン ウェブ サービス ジャパン株式会社の呉(Twitter: @kazuneet)です。AWS Japan では、2020年からAI/ML関連情報を発信するイベント「AWS AI/ML@Tokyo」を定期的に開催しています。2020年7月9日にオンラインで開催された AWS AI/ML@Tokyo #5では、AWS Japan によるAmazon EKS (Kubernetes + Kubeflow) と Amazon SageMaker を題材とした機械学習基盤選択の考え方と、 実際に機械学習基盤として Amazon SageMaker と Airflow を組み合わせた機械学習パイプラインを構築されたお客様をゲストスピーカーにお招きし、お客様による「体験談」をお話し頂きました。

Read More

新機能 – Amazon SageMaker Ground Truth による動画のラベル付け

AWS re:Invent 2018 で提供を開始した Amazon Sagemaker Ground Truth は、機械学習データセットに簡単に注釈を付けることができる Amazon SageMaker の 1 機能です。お客様は、画像やテキストおよび 3D ポイントクラウドデータには組み込みのワークフローを、また他のデータタイプにはカスタムワークフローを使用して、効率的かつ正確なラベルを付け実施することができます。データサンプルは自動的に作業担当者(社内、サードパーティー、または MTurk)に配布されます。また、注釈は Amazon Simple Storage Service (S3) に保存されます。オプションの自動データラベル付けを有効にすると、データセットのラベル付けに必要な時間と関連するコストの両方を削減することもできます。 現在、モデルの精度が向上するにつれ、AWS のお客様が動画コンテンツの予測に機械学習を適用する機会もますます増えています。自律運転は、安全性の面から、道路状況や移動する物体を正確に検知しリアルタイムで追跡することが求められるということで、おそらく最も知られたユースケースと言えるでしょう。動画の予測はスポーツの分野にも普及しているアプリケーションです。ここでは、プレーヤーやレースカーを追跡し、ファンを喜ばせるための、あらゆる種類の統計情報を計算しています。医療機関においても、医療画像内の解剖学的対象を特定および追跡するために、動画予測技術を利用しています。製造業では、組み立てライン上の物体、出荷する荷物、その他の対象に対し、同様な技術を適用しています。こういった実例の枚挙にはいとまがありませんし、また、他の多くの業界においても素晴らしい応用例が登場し続けているのです。 もちろん、これらには動画データセットの構築とラベル付けが必要であり、追跡の対象には手動でのラベル付けが行われます。毎秒 30 フレームとしても、動画 1 分間では 1,800 個の個別画像が転送されることになり、そのための作業は即座に手に余る量に達してしまいます。さらに言えば、画像へのラベル付けやワークフローの管理、さらにその他の目的で、専用ツールを構築する必要もあるのです。これらの作業は、コアビジネスに向けるべき相当量の時間とリソースを、組織から奪い去ってしまいます。 AWS では、このためのより良いソリューションのご要望をお客様からいただいてきました。そして本日、Amazon Sagemaker Ground Truth が動画のラベル付け機能をサポートすることを発表できるようになりました。 お客様でのユースケース例: National Football League National Football League (NFL) では、この機能が既に稼働しています。NFL のプレーヤーヘルスとイノベーション担当 SVP である、Jennifer Langton 氏によれば、「National Football League (NFL) […]

Read More