Amazon Web Services ブログ

Category: Amazon SageMaker

Amazon SageMaker Canvas を発表 – ビジネスアナリスト向けの視覚的でノーコードの機械学習機能

ビジネス上の問題に直面し、日常的にデータを扱う組織として、ビジネスの成果を予測できるシステムを構築する能力が非常に重要になります。この能力があると、低速なプロセスを自動化し、IT システムにインテリジェンスを組み込むことで、問題の解決と迅速な対応が可能になります。 しかし、組織内のすべてのチームと個々の意思決定者が、他のデータサイエンスチームやデータエンジニアリングチームに依存することなく、このような機械学習 (ML) システムを大規模に作成できるようにするにはどうすればよいでしょうか? ビジネスユーザーまたはデータアナリストは、何百ものアルゴリズム、トレーニングパラメータ、評価メトリクス、デプロイのベストプラクティスについて学ぶことなく、毎日分析および処理するデータに基づいて予測システムを構築して使用したいと考えています。 2021 年 11 月 30 日(米国時間)、 Amazon SageMaker Canvas が一般提供されたことをお知らせします。これは、ビジネスアナリストがコードを書いたり、MLの専門知識なしに、ML モデルを構築して正確な予測を生成できる、新しいビジュアルでコードを使用しない機能です。

Read More
Full Architecture

Amazon SageMaker で CVAT AI 自動画像アノテーションシステムをデプロイする

この記事は”使用 Amazon SageMaker 部署 CVAT AI 自动图像标注系统”を翻訳したものです。(原文は中国語のものです) 背景紹介 Amazon SageMaker はデベロッパーとデータサイエンティストを支援して、機械学習 (Machine Learning, ML) モデルの準備、構築、トレーニングおよびデプロイの一連の機能を提供するフルマネージド型クラウドサービスです。 機械学習において学習データは非常に重要であり、コンピュータビジョン (Computer Vision, CV) 領域の教師あり学習課題を取り扱う時の大事な一歩は学習データにアノテーションを付けることです。CVAT (Computer Vision Annotation Tool) は画像やビデオに自動的にアノテーションを付けてくれる便利なツールです。2018 年に GitHub でオープンソース化されて以来多くの注目を集めており、AI 自動画像アノテーション機能は非常に人気です。 公式のCVATインストールガイドではスタンドアロンデプロイ方式が推奨されています。このデプロイ方式はアプリケーション層、データベース層、キャッシュ層、AI 推論層の全てを Docker 経由で単一物理マシンまたは仮想マシン上に展開します。この方法だとリソースの活用、セキュリティ、高可用性などの観点でエンタープライスレベルの準拠を満たすことが難しいので、本記事では CVAT プラットフォームを AWS のサーバーレス上にデプロイする方法について紹介します。

Read More

Amazon SageMakerとAmazon QuickSightを使用した有害事象のリアルタイム検出システムの構築

この記事は “Build a system for catching adverse events in real-time using Amazon SageMaker and Amazon QuickSight” を翻訳したものです。 ソーシャルメディアプラットフォームは、消費者が服用している医薬品を含むさまざまな製品について話すためのコミュニケーションチャネルを提供します。製薬会社にとって、製品の作用を監視して効果的に追跡することで、製品に関する顧客からのフィードバックが得られます。これは、患者の安全の維持と向上に不可欠です。しかし、医薬品投与による予期せぬ医療事象が発生した場合は、有害事象(AE)に分類されます。これには、投薬過誤、薬物有害反応、アレルギー反応、過剰摂取が含まれます。AEは、病院、介護施設、外来患者の環境など、どこでも発生する可能性があります。

Read More

AWSを活用した次世代型ハイブリッドおよびバーチャル臨床試験

この記事は “Running next generation hybrid and virtual clinical trials on AWS” を翻訳したものです。 CliniOpsは、AI、モバイル、分析、クラウド、センサー、コネクテッドデバイスを活用して、デジタル臨床試験をサポートする、ライフサイエンス業界向けのデータサイエンスプラットフォームを提供しています。遠隔医療を組み込んだこの斬新な統合プラットフォームアプローチは、被験者、医療機関、製薬企業向けにカスタム設計されており、低コストで高いデータ品質を保証します。また、このプラットフォームは非常に柔軟で協調性が高く、臨床オペレーション、データマネジメント、生物統計、薬事の各機能にわたるワークフローを合理化します。

Read More

データサイエンティスト向けのフルマネージド RStudio on Amazon SageMaker を発表

2 年前、当社は業界初の機械学習 (ML) 向けの完全統合開発環境 (IDE) である Amazon SageMaker Studio の提供を開始しました。Amazon SageMaker Studio は、すべての機械学習の開発ステップを実行できる単一かつウェブベースのビジュアルインターフェイスを提供します。これにより、データサイエンスチームの生産性が最大 10 倍向上します 多くのデータサイエンティストは、18,000 を超えるパッケージを含むオープンソースのエコシステムである R プロジェクトを愛用しています。これは単なるプログラミング言語ではなく、データサイエンスのためのインタラクティブな環境でもあります。RStudio は、R デベロッパーの間で最も人気のある、機械学習およびデータサイエンスプロジェクト向けの IDE の 1 つです。RStudio は、R 向けのオープンソースツールと、データサイエンスチームが開発したり、成果物を組織内で共有したりするためのエンタープライズ対応のプロフェッショナルソフトウェアを提供します。しかし、RStudio を自ら構築、保護、スケーリング、およびメンテナンスするのは面倒で手間がかかります。 2021 年 11 月 2 日(米国時間)、RStudio PBC と共同で、クラウドにおける業界初のフルマネージド RStudio Workbench IDE である RStudio on Amazon SageMaker の一般提供を発表しました。

Read More

Amazon SageMaker でコンピュータビジョン推論に最適な AI アクセラレータとモデルコンパイルを選択

この記事は、2021 年 10 月 19 日に Davide Gallitelli 、 Hasan Poonawala によって投稿された Choose the best AI accelerator and model compilation for computer vision inference with Amazon SageMaker を翻訳したものです。 AWS のお客様では、コンピュータビジョンモデルによる予測で強化されたアプリケーションを構築するケースが増えています。例えば、フィットネスアプリケーションでは、カメラの前で運動しているユーザーの体の姿勢を監視し、ユーザーにライブフィードバックと定期的なインサイトを提供します。同様に、大規模な倉庫の在庫検査ツールでは、ネットワーク全体で何百万もの画像をキャプチャして処理し、本来あるべき場所にない在庫を発見します。 モデルの学習後、機械学習 (ML) チームは、モデルを本番環境にデプロイするための適切なハードウェアおよびソフトウェア構成を選択するために最大数週間かかることがあります。コンピューティングインスタンスタイプ、AI アクセラレータ、モデルサービングスタック、コンテナパラメータ、モデルコンパイル、モデル最適化など、いくつかの選択肢があります。これらの選択肢は、スループットやレイテンシーなどアプリケーションのパフォーマンス要件、およびコストの制約によって異なります。ML チームは、ユースケースに応じて、低い応答レイテンシー、高いコスト効率、高いリソース使用率、またはこれらの特定の制約の組み合わせを最適化する必要があります。コストパフォーマンスを最適化するために、ML チームはさまざまな組み合わせをチューニングし、負荷テストを行い、与えられた入力データとモデル出力データで比較可能なベンチマークを用意する必要があります。

Read More

小売業におけるアダプティブ分析: 顧客の行動とエンゲージメントに影響を与える

小売業界において、日常業務におけるデータの重要性に異論のある方はいないでしょう。バッチレポートから意思決定支援、ビジネスインテリジェンスシステムまで、小売の意思決定における運用データの進化は非常に多岐にわたります。今日、アダプティブ分析プラットフォームは、小売業者が次のことができるよう、業界のイノベーションを推進しています。 ビジネスにおける重要なシグナルを検出します。 これらのシグナルの現在の意味と将来の予測を導き出します。 データドリブンな顧客、製品、マーケティング戦略で対応します。 しかし、アダプティブ分析プラットフォームを構築するためには、小売業の経営者が直面する多くの戦略的課題があります。例えば、急速に変化する買い物客の影響や行動のトリガー、人口動態の変化、COVID-19 などの世代別市場レベルの影響、主要な経済圏の景気低迷といった課題や、お客様対応とオペレーション業務を効果的に行うために、予測に基づいた洞察が求められる小売業の職種が一層増えていることなどが挙げられます。

Read More

自動シャットダウン拡張機能を利用した Amazon SageMaker Studio のコスト削減方法

Amazon SageMaker Studio は、すべての機械学習開発ステップを実行できる、統合された Web ベースのビジュアルインターフェイスを提供し、データサイエンスチームの生産性を最大 10 倍にします。Studio では、モデルの構築、トレーニング、デプロイに必要な各ステップへの完全なアクセス、制御、可視性を提供します。Studio ノートブックは、コンピューティングインスタンスとファイルストレージを事前に設定する必要がなく、すばやく起動できるコラボレーションノートブックです。Amazon SageMaker は、インフラストラクチャ管理を抽象化する機能を提供するフルマネージド型サービスで、さまざまな機能と従量課金制の料金モデルを備えた大規模な機械学習ワークロードに必要な俊敏性とスケーラビリティを提供します。 このブログでは、下記の実現方法について紹介します。 Studio のコストを削減するために、自動シャットダウン拡張機能を利用しStudio 内のアイドル状態のリソースを検出してシャットダウンする Studio ドメイン内のすべてユーザーが自動シャットダウン拡張機能を利用するために、自動でユーザープロファイルを追跡し管理者へ通知する 課金が見落とされがちな Amazon SageMaker Data Wrangler のコストを管理するために、自動シャットダウン拡張機能を利用する

Read More

機械学習と AWS Inferentia を使用した広告検証のスケーリング

Amazon Advertising は、15 を超える国々のウェブサイト、アプリケーション、ストリーミング TV コンテンツなど、Amazon のストア内外の両方で表示される広告を通じて、企業がブランドを構築し、お買い物をするお客様とつながるのをサポートします。Amazon Marketplace の登録販売者、ベンダー、書籍ベンダー、Kindle ダイレクトパブリッシング (KDP) の著者、アプリケーションデベロッパー、代理店など、あらゆる規模の企業やブランドが、独自の広告クリエイティブをアップロードできます。これには、画像、動画、音声のほか、Amazon で販売されている商品ももちろん含まれます。正確、安全、快適なショッピング体験を促進するために、これらの広告はコンテンツガイドラインに準拠している必要があります。 ここでは簡単な例を挙げます。次の広告のうち 2 つが準拠していない理由がおわかりでしょうか?

Read More

Amazon SageMaker で Detectron2 を使って物体検出する

この記事は、こちらの AWS blog を翻訳したものです。 深層学習は、さまざまな分野で機械学習(ML)を実装する際の最重要課題となっています。ニューラルネットワークの柔軟性の高さを背景に、コンピュータビジョン(CV)の物体検出タスクなどではニューラルネットワークが人間よりも優れた性能を発揮することが可能になってきました。 CVタスクの1つである物体検出は、医療、小売、農業など様々な分野で応用されています。たとえば小売業では、店舗の棚の画像からSKU(Stock Keeping Unit)を検出して、購買者の傾向を分析したり、商品の再入荷時期を特定したりしたいと考えています。物体検出モデルは、このような多様なユースケースを実現し、店舗内のオペレーションを自動化することができます。 この記事では、Facebook AI Research(FAIR)が公開した物体検出・セグメンテーションフレームワークであるDetectron2と、Amazon SageMaker への実装について説明し、小売業向けの高密度な物体検出タスクを解決します。また、関連するサンプルノートブックもご紹介しますので、そちらを実行することでこの記事でご紹介するすべての機能を試すことができます。詳細については、GitHubリポジトリ をご覧ください。

Read More