ノーコード機械学習 — Amazon SageMaker Canvas に関するよくある質問

全般

Q: Amazon SageMaker Canvas とは何ですか?

Amazon SageMaker Canvas はコード不要の機械学習 (ML) サービスです。SageMaker Canvas は、データ準備、モデルの構築とトレーニング、予測の生成、本番環境へのモデルのデプロイなど、ML ワークフロー全体をサポートします。 SageMaker Canvas では、ML を使用して不正行為の検知、メンテナンス障害の予測、財務指標と売上の予測、在庫の最適化、コンテンツの生成などを行うことができます。

Q: Amazon SageMaker Canvas の使用を開始するにはどうすればよいですか?

Amazon SageMaker Canvas にアクセスするには、まず AWS マネジメントコンソールで SageMaker ドメインを作成します。SageMaker ドメインを作成すると、2 つの方法で SageMaker Canvas にアクセスできるようになります。まず、SageMaker Canvas を AWS マネジメントコンソールから直接起動することも、ML 用の統合 IDE である SageMaker Studio 内で SageMaker Canvas を起動することもできます。

SageMaker Canvas にログインすると、ML の各ステップをわかりやすく案内するインタラクティブな製品ツアーをお試しいただけます。さらに、SageMaker Canvas で提供されるサンプルデータセットを使用して、住宅価格予測、売上予測、ローン不履行予測など、一般的なユースケースを始めることができます。

Q: Amazon SageMaker Canvas はどの SSO 技術をサポートしていますか?

SageMaker Canvas は、Security Assertion Markup Language (SAML) 2.0 対応のすべての SSO 技術をサポートしています。例えば、AWS SSO、Active Directory、Okta などです。

Q: Amazon SageMaker Canvas の料金はどのように請求されますか?

SageMaker Canvas では、使用した分の料金のみをお支払いいただきます。請求額は 3 つの要因によって決まります。

Workspace インスタンス (セッション - 時間): これは、SageMaker Canvas にログインしている時間数、または SageMaker Canvas を使用している時間数に基づきます。この時間は、SageMaker Canvas を起動したときに始まり、アプリケーションまたは管理者からログアウトしたときに終了します。
モデルトレーニング料金
- 表形式モデル: カスタム表形式モデルのトレーニング料金は、モデルのトレーニングに使用されたデータセット内のセルの数に基づいています。
- CV と NLP モデル: カスタム NLP モデルと CV モデルのトレーニング料金は、モデルのトレーニングにかかる時間に基づいています。
推論料金
- リアルタイムエンドポイント: リアルタイムエンドポイントにモデルをデプロイすると SageMaker リソースが使用され、これらのリソースの使用量に対して課金されます。
- すぐに使用できるモデルの使用: インサイトを生成し、ドキュメント、画像、テキストから情報を抽出するためのすぐに使用できるモデルの使用では、AWS の AI サービスを利用しています。ユーザーが使用する、すぐに使用できるモデルで利用されているそれぞれのサービスについての料金が請求されます。
- カスタムモデル予測: トレーニング済みモデルから単一予測またはバッチ予測を生成するために使用するコンピューティングに対して課金されます。

詳細については、SageMaker Canvas の料金ページをご覧ください。

Q: コストを管理して Amazon SageMaker Canvas からログアウトする方法を教えてください。

SageMaker Canvas にログインすると、1 時間あたりのセッションレートが関連付けられた専用のコンピューティングリソースが使用可能になります。コストを抑えるため、その日の作業が終了したら、左側のナビゲーションパネルの下部にあるログアウトアイコンをクリックして SageMaker Canvas からログアウトしてください。または、管理者がプログラムによってユーザーをログアウトさせることもできます。Workspace インスタンス (セッション - 時間) の課金は、ユーザーがログアウトするか、管理者がログアウトすると停止されます。管理者は、固定時間のスケジュールでプログラムによる方法を使用するか、TimeSinceLastActive と呼ばれる Amazon CloudWatch メトリックスを使用して、目的のアイドル期間の後に動的にログアウトさせるかを選択できます。

Q: Amazon SageMaker Canvas は、どのリージョンで利用できますか?

Amazon SageMaker Canvas は、米国東部 (オハイオ)、米国東部 (バージニア北部)、米国西部 (オレゴン)、欧州 (フランクフルト)、欧州 (アイルランド)、アジアパシフィック (ムンバイ)、アジアパシフィック (ソウル)、アジアパシフィック (シンガポール)、アジアパシフィック (東京)、オーストラリア (シドニー) の AWS リージョンでご利用いただくことができます。

Amazon SageMaker Canvas でデータや機械学習モデルを暗号化するにはどうすればよいですか?

SageMaker Canvas は、分類、リグレッション、時系列予測を含むすべてのユースケースにおいて、AWS Key Management Service (AWS KMS) を用いたカスタマーマネージドキー (CMK) によるデータセットおよび ML モデルの保管時の暗号化をサポートしています。モデルのトレーニングおよびインサイトの生成に使用されるインスタンス上のファイルシステムの暗号化や、Amazon S3 バケット内のモデルデータの暗号化に独自のキーを使用することができます。

SageMaker Canvas でのデータ準備

Q: Amazon SageMaker Canvas はどのデータソースをサポートしていますか?

SageMaker Canvas を使用すると、Amazon Simple Storage Service (S3)、Amazon Athena (Glue Data Catalog)、Amazon Redshift、Amazon Aurora、Amazon RDS など、アカウントがアクセスできる AWS データソースをシームレスに検出できます。SageMaker Canvas は、Salesforce データクラウド、スノーフレーク、データブリックス、40 以上の SaaS プラットフォームなどの外部データソースもサポートしています。最後に、ローカルディスクからファイルをドラッグアンドドロップして、データセットを SageMaker Canvas にアップロードできます。

Q: Amazon SageMaker Canvas はどのデータタイプをサポートしていますか?

SageMaker Canvas は、表形式 (CSV、パーケット)、画像 (JPEG、PNG)、およびドキュメントデータ (PDF、JPG、PNG、TIFF) のインポートをサポートしています。

データを分析、解析するにはどうしたらよいですか?

SageMaker Canvas では、あらかじめ用意されたビジュアライゼーションを使用してデータを分析および探索したり、自然言語を使用してカスタムビジュアライゼーションを生成したりできます。Amazon SageMaker Canvas は、データの品質 (欠損値、重複行、データタイプなど) を検証し、データの異常 (外れ値、クラス不均衡、データ漏洩など) を検出するためのデータ品質と洞察レポートも提供します。

Q: Amazon SageMaker Canvas でデータを準備するにはどうすればよいですか?

SageMaker Data Canvas には、PySpark ベースのビルド済みデータ変換が 300 以上用意されているため、コードを 1 行も記述せずに、データを変換してデータ準備ワークフローをスケールできます。さらに、FM を利用した自然言語命令を使用して ML モデルのデータを変換できます。

Q: Amazon SageMaker Canvas で構築したデータ準備フローを自動化するにはどうすればよいですか?

SageMaker Pipeline との統合により、ジョブを起動またはスケジュールしてデータを迅速に処理したり、データ準備フローを ML ワークフローの処理ステップとしてエクスポートしたりできます。

Q: データを検証し、モデルを構築する準備ができていることを確認するにはどうすればよいですか?

SageMaker Canvas は、データ準備フローにデータ品質およびインサイトレポートを提供して、データ品質を確認し、モデル精度を推定します。また、モデルを構築する前にデータを検証して、一般的な問題がないか確認します。

SageMaker Canvas のカスタムモデルですぐに使えるモデル

Q: Amazon SageMaker Canvas はファンデーションモデルをサポートしていますか?

はい。SageMaker Canvas では、コンテンツ生成、テキスト抽出、およびテキスト要約のためのすぐに使用できる基盤モデル (FM) にアクセスできます。Claude 2、Amazon Titan、Jurassic-2 (Amazon Bedrock 搭載) などの FM や、Falcon や MPT (SageMaker JumpStart を搭載) などの一般公開されている FM にアクセスしてカスタマイズできます。コードを記述する必要はありません。

Q: Amazon SageMaker Canvas はどのようなすぐに使用できるモデルをサポートしていますか?

SageMaker Canvas には、表形式、NLP、および感情分析、画像内のオブジェクト検出、画像内のテキスト検出、エンティティ抽出などのユースケースが用意されています。さらに、すぐに使用できるモデルはモデルの構築を必要とせず、Amazon Rekognition、Amazon Textract、Amazon Comprehend などの AWS の AI サービスを利用しています。

Q: Amazon SageMaker Canvas ではどのような種類の ML モデルを作成できますか?

現在、SageMaker Canvas では、分類 (二項および複数カテゴリ)、リグレッション、予測、単一ラベル画像分類、およびマルチカテゴリテキスト分類モデルを作成できます。

Q: SageMaker Canvas でモデルを作成する方法を教えてください。

SageMaker Canvas では、モデルを構築するために複数のオプションが用意されています。

プレビュー: このオプションは、モデルの正確性と特徴量重要度を示す指標として、モデルを約 2 分間でプレビューすることができます。
クイック構築: このオプションは、モデルを素早く (約 2～20 分) 構築し、既製のモデルを提供することができます。
スタンダード構築: このオプションは広範なもので、データセットのサイズによっては数時間かかる場合があります。スタンダード構築モデルでは、メトリクススコア、ハイパーパラメータの異なる組み合わせによるトレーニング実験、バックエンドでの複数のモデルの生成などの詳細な情報が提供されます。さらに、ユーザーが評価し、使用できる最適なモデルが選択されます。

Q: 自分のモデルを他の人に説明するにはどうしたらいいのでしょうか?

SageMaker Canvas では、データセットの各カラムがモデルに与える影響を説明するカラムインパクト分析を提供しています。SageMaker Canvas には、モデルパフォーマンスの可視性を提供する追加メトリクスも用意されています。さらに、予測を生成する際に、各予測に最も影響を与える列を特定する列インパクトを確認することができます。

Q: データサイエンティストは Amazon SageMaker の外部で構築したモデルを共有し、Amazon SageMaker Canvas でそのモデルの予測を生成することができますか?

はい。データサイエンティストは、他のツールで構築した機械学習モデルを SageMaker Model Registry に一旦登録すれば共有できるので、お客様は SageMaker Canvas でこれらのモデルの予測を生成することができます。

SageMaker Canvas を使用して予測を行う

Q: 予測はどのように行うのですか?

単一予測を行うには、対応するモデルバージョンの「単一予測」タブで値を入力すると、SageMaker Canvas が予測を表示します。また、スライダーやプルダウンメニューを使用して入力値を変更し、予測値への影響を確認することもできます。複数の観測値やデータ行について予測を行うには、[bulk prediction](一括予測) タブで、観測値を含む CSV、JPEG、または PNG ファイルをドラッグアンドドロップすると、SageMaker Canvas が予測値を含む新しい CSV、JPEG、または PNG ファイルを作成します。SageMaker Canvas では、手動または自動のバッチ予測を実行できます。自動のバッチ予測ワークフローは、関連するデータセットが更新されるたびにトリガーされます。その後、予測結果をインラインで確認することも、ダウンロードして確認することもできます。

Q: Amazon SageMaker Canvas から予測を使用して予測ダッシュボードを構築するにはどうすればよいですか?

SageMaker Canvas では 1 つまたは複数のバッチ予測を選択し、それをアカウント内の複数の Amazon QuickSight ユーザーに送信できます。SageMaker Canvas からワンクリックで QuickSight を開き、予測をデータセットとして分析し、新しいデータや変更されたデータに合わせて継続的に更新できる予測ダッシュボードを構築して公開できます。

SageMaker Canvas モデルを MLOps 用 SageMaker Studio と一緒に使用する

Q: Amazon SageMaker Canvas で構築したモデルをデータサイエンティストと共有し、共同作業することはできますか?

はい。SageMaker Canvas で構築した機械学習モデルは、SageMaker Studio で作業しているデータサイエンティストと共有することができます。データサイエンティストは、更新されたモデルのバージョンを確認、更新、共有することができるので、SageMaker Canvas の新しいバージョンで予測を生成することができます。

SageMaker Canvas で標準モデルを構築してトレーニングした後、SageMaker Canvas の共有ボタンを使用して機械学習モデルを共有することができます。SageMaker Studio 内で、モデルを 1 人のユーザーに共有するか、複数のユーザーに共有するかを選択することができます。

Q: Amazon SageMaker Canvas から Amazon SageMaker Studio に共有できる機械学習モデルアーティファクトは何ですか?

SageMaker Canvas から共有される機械学習モデルとアーティファクトには、データセット、データ変換 (レシピデータフローと変換コードを含む)、候補モデルのリストとレコメンデーションモデル、データ探索レポート、候補定義ノート、説明可能性メトリクス (機能重要度を含む) などが含まれます。

Q: データサイエンティストが編集および更新できるアーティファクトは何ですか?

SageMaker Studio を使用しているデータサイエンティストは、モデルのアーティファクトを表示し、SageMaker Autopilot の候補リストから別の候補を推薦することができます。また、SageMaker Data Wrangler でデータ変換を開いて更新し、SageMaker Autopilot でモデルを更新して、新しいモデルのバージョンを共有することができます。

Q: SageMaker Studio ユーザーは、SageMaker Canvas から受け取ったモデルをどのように更新することができますか?

SageMaker Studio ユーザーは、SageMaker Studio 内の共有ボタンを使用してモデルのバージョンの更新を送信することができます。SageMaker Studio から更新されたモデルは、共有された元のモデルの新しいバージョンとして、直接 SageMaker Canvas に表示されます。

Q: 元の共有モデルと新しい共有モデルをどのように区別すればよいですか?

更新されたモデルは、SageMaker Canvas 内で自動的にバージョン管理されます。SageMaker Canvas 内のドロップダウンメニューから、異なるバージョンのモデルにアクセスすることができます。

Q: Amazon SageMaker Canvas から Amazon SageMaker Studio に共有できるユースケースとモデルタイプは何ですか?

顧客離れ、住宅料金の予測、売上予測、ローンの不履行の予測、病院の病床使用率の予測、時系列予測モデルなど、SageMaker Canvas 内のすべてのユースケースについて、表形式データを含む標準構築モデルを共有できます。カスタム CV モデルや NLP モデルを共有することもできます。

独自の機械学習モデルを使用

Q: Amazon SageMaker Canvas で作成した機械学習モデルを既存の MLOps CI/CD プロセスにプッシュすることはできますか?

はい。SageMaker Canvas で機械学習モデルを作成したら、SageMaker Model Registry に登録して、既存のモデルデプロイ CI/CD プロセスにプラグインすることができます。SageMaker Model Registry は、機械学習モデルのカタログ化、さまざまなモデルバージョンの管理、メタデータの関連付け、モデルの承認状況の管理、および本番環境へのデプロイを行うリポジトリです。

Q: Amazon SageMaker Canvas ではモデル登録はどのように機能しますか?

SageMaker Canvas でモデルバージョンを選択して自分のアカウントで SageMaker Model Registry に登録すると、SageMaker Canvas は、モデル推論コンテナへの参照リンク、モデル機能の重要性レポート、トレーニングメトリクスなどのモデルメタデータ、関連チャートなどのモデルアーティファクトを自動的に SageMaker モデルレジストリに送信します。モデルが登録されると、SageMaker Canvas で承認ステータスを追跡できます。SageMaker モデルレジストリでモデルを拒否すると、モデルがエスカレートされた環境にデプロイされなくなります。一方、SageMaker モデルレジストリでモデルを承認すると、モデルプロモーションパイプラインがトリガーされる可能性があります。モデルプロモーションパイプラインは、モデルを本番稼働前の AWS アカウントに自動的にコピーし、モデルが推論ワークロードに対応できるようになったことをトリガーします。

生成系 AI 機能

Q: Amazon SageMaker Canvas は生成系 AI をどのようにサポートしていますか?

SageMaker Canvas は、Amazon Bedrock と SageMaker Jumpstart を搭載した、すぐに使える基盤モデル (FM) を提供しています。これらのモデルにより、コンテンツの生成と要約が可能になります。自然言語による指示を使用すると、説明文、レポート、ブログ投稿の作成、質問への回答、メモや記事の要約、概念の説明などのタスクを、コードを 1 行も記述せずに実行できます。お客様のデータは、基本モデルの改善には使用されず、サードパーティのモデルプロバイダーと共有されることもなく、完全に安全な AWS 環境内に留まります。同じコード不要のインターフェイスで、データセットをアップロードして FM を選択できます。SageMaker Canvas では、予測をすぐに生成するためのカスタム基盤モデルを自動的に構築できます。SageMaker Canvas にはパフォーマンス指標も表示されるため、FM を使用して簡単に共同作業を行って予測を生成し、FM が特定のタスクでどの程度うまく機能しているかを把握できます。

Q: Amazon SageMaker Canvas はファンデーションモデルに対してどのようなコントロールを提供していますか?

SageMaker Canvas には、管理者が SageMaker Canvas ユーザーインターフェイス内の基盤モデルへのアクセスを制御するための権限が用意されています。これには、データ準備などの基礎モデルを基盤とする機能と、すぐに使用できる基盤モデルの両方が含まれます。