ナカの人に聞いてみた ~
Amazon SageMaker Canvas でノーコードで機械学習を始めよう!
米倉 裕基, シン シオリ
builders.flash 読者の皆様こんにちは。
テクニカルライターの米倉 裕基と申します。
「ナカの人に聞いてみた」と題した本シリーズは、実際に AWS で働くソリューションアーキテクトの皆さんに、各種 AWS サービスの機能や利点を聞いてみようというインタビュー形式の記事になります。
第 6 回のゲストは DNB ソリューションアーキテクトとして活躍されているシン シオリ (Xiaoli Shen) さんです。
本記事では、コードを一切書かずに機械学習 (ML) モデルを作成し、ML 予測を生成できる「Amazon SageMaker Canvas (以下 SageMaker Canvas)」というサービスの魅力や機能について教えていただきます。
本シリーズのその他の記事はこちら
- 選択
- AWS の位置情報サービスでリッチなマップを実装しよう !
- Amazon Kinesis Video Streams で監視カメラシステムを構築しよう!
- Amazon CodeCatalyst で開発環境の構築とチームコラボレーションを加速しよう!
- エンタープライズ検索サービス Amazon Kendra で知りたい情報をすぐに検索 !
- クラウドコンタクトセンターを簡単セットアップ !
米倉 裕基
こんにちは、シンさん。
この度は、第 6 回「ナカの人に聞いてみた」のゲストとしてお迎えできて大変嬉しく思います。
シン シオリ
米倉さん、よろしくお願いいたします。
米倉 裕基
こちらこそよろしくお願いします。
さっそくですが、読者の皆様にご自身を簡単にご紹介いただけますか ?
シン シオリ
はい、皆さん、初めまして。シン シオリと申します。
2021 年に AWS Japan に入社し、現在ソリューションアーキテクトとして活動しています。特にデジタルネイティブビジネスのお客様の支援に力を入れています。
今年でエンジニアとして 10 年目で、日本にきて 7 年目になります。
AI/ML が大好きで、個人活動として機械学習関連の ブログ 執筆 とワークショップコンテンツ やサンプルアプリケーションの開発を行っています。
読者の皆さん、どうぞよろしくお願いいたします。
米倉 裕基
シンさんは、特に AI/ML の領域に注目されているんですね。
シン シオリ
そうですね ! 最近では生成 AI にハマっていまして、LLM (大規模自然言語モデル) をファインチューニングしたり、Stable Diffusion でテキストから画像を生成するデモを作ったりして、AI に溢れた未来を想像しながらコーディングを楽しんでいます。
米倉 裕基
生成 AI は、昨今特に注目されている分野ですもんね。
生成 AI はもちろん、AI/ML 関連の開発ってすごく興味はあるんですが、なかなか私のような素人には手が出しづらいというか・・・。
シン シオリ
これは私個人の見解ですが、AI/ML は今後、エンジニア以外のビジネスパーソンも含め、どんな職種でも必須のテクノロジーとなると考えています。
だからこそ、「誰でも簡単に機械学習を活用できるようにする」という機械学習の民主化のビジョンに強く共感し、ローコード・ノーコードの機械学習ツールの普及に積極的に取り組んでいます。
米倉 裕基
「機械学習の民主化」ですか、面白い表現ですね !
なるほど、そのような背景で、今回ノーコードの機械学習ツールである SageMaker Canvas をご紹介いただけるわけですね。
シン シオリ
はい!実際の普及活動の一環として、AWS Innovate AI/機械学習エディションで AWS のローコード機械学習ツールを紹介するセッション を行なったり、今回のテーマとなるノーコード機械学習ツールの SageMaker Canvas のハンズオン動画教材 を作ったりしています。
ご興味あればぜひご覧ください。
米倉 裕基
すでに、SageMaker Canvas のハンズオン動画が公開されてるんですね !
すごく興味あります ! ぜひ視聴させていただきます。
Amazon SageMaker Canvas とは ?
米倉 裕基
まずは、今回のインタビューのテーマである SageMaker Canvas のおおまかな概要から伺ってもよろしいでしょうか。
簡単に言うと、何ができるサービスなんでしょうか ?
シン シオリ
SageMaker Canvas は、まさに「機械学習の民主化」をビジョンとしたサービスで、ノーコードで AI や機械学習を手軽に扱えるように設計されています。
つまり、専門家でなくても簡単に機械学習モデルを作って予測を可能にするツールなんです。
Amazon SageMaker Canvas
の製品ページ
米倉 裕基
機械学習モデルの構築や利用は通常、高度な数学や統計の知識やプログラミングスキルが必要とされますよね ?
シン シオリ
そうですね。機械学習は大量のデータから確率的なパターンを抽出し、それを用いて高度な予測や判断を行います。これには高い専門知識が求められます。
米倉 裕基
だからこそ、その領域に特化したデータサイエンティストや機械学習エンジニアなどの専門家がいらっしゃるわけですもんね。
シン シオリ
確かにそうですね。機械学習モデルを構築すると言ったら、高度な専門知識を持つデータサイエンティストが、Python コードをゴリゴリ書いて、複雑なアルゴリズムを実現するとイメージを持たれがちです。
米倉 裕基
まさにそういうイメージでした。
シン シオリ
ただ、多くの機械学習を活用したビジネスアイデア自体は、ビジネス側の担当者から主に出てくるものです。
データサイエンティストや機械学習エンジニアが果たす役割は、そのアイデアを技術的に実現することです。
問題点としては、肝心のデータサイエンスチーム側が既存の ML プロジェクトに忙殺されて、なかなか新規のプロジェクトに取り組む余裕がないことです。
米倉 裕基
ビジネス側がアイデアを出し、データサイエンティスト側がそれを形にするという協力関係ですね。
ただ、そのシナジーが上手く機能するうちは良いのですが、実際にはデータサイエンティスト側の稼働が厳しく体制面で課題があるということですね。
シン シオリ
はい。実際、業務プロセスに詳しいビジネスアナリストやビジネスユーザーの方が、AI を使って何ができるかについてのアイデアを豊富に持っているものです。
ただ、データサイエンティストがいない状況では、せっかくのアイデアも専門知識やプログラムスキルの不足が障壁になり実現できないというようなことがあります。
SageMaker Canvas を介した
モデルの共有
(クリックすると拡大します)
米倉 裕基
専門知識やスキルの不足がアイデアの実現を阻むのはもったいなく感じますね。
シン シオリ
そこで SageMaker Canvas が役に立ちます。
SageMaker Canvas を使えば、専門知識のあるなしに関わらず、誰でも数クリックするだけで機械学習モデルを構築でき、高度なタスクも効率的に実行できるんです。
ビジネス側の担当者も手軽に機械学習を活用できれば、イノベーションの加速が期待できると思いませんか ?
米倉 裕基
そうですね。専門知識が不足していても、アイデアを手軽に具現化できる仕組みがあれば、組織のリソース制限に縛られずに新しいプロジェクトを進められる可能性が広がりますもんね。
シン シオリ
はい。それに、SageMaker Canvas は専門知識がない人にとって便利なのはもちろんのこと、実際には機械学習に精通している人にとっても有用なツールでもあるんですよ。
SageMaker Canvas を使用することで、データサイエンティストが通常行うデータ探索、前処理、特徴量エンジニアリングなどの高度なタスクも効率的に実行できるんですよ。
米倉 裕基
なるほど ! では、機械学習に詳しくない人だけをターゲットにしたサービスというわけではないんですね。
シン シオリ
その通りです。SageMaker Canvas を現場で利用する最大の利点は、ビジネスユーザーとデータサイエンティストがコラボレーションしやすい環境を提供できる点だと思います。
例えば、ビジネスユーザーが SageMaker Canvas で作ったモデルは、データサイエンスチームが使う専門のツールである SageMaker Studio でレビューや更新ができますし、反対に専門家が作ったモデルをビジネスユーザーが簡単に利用することもできます。
米倉 裕基
機械学習の専門家とビジネスユーザーがお互いのスキルセットを最大限に活かしながら、スムーズに連携できる機械学習の環境を提供するサービスというわけですね。
コラボレーションでアイデア実現
シン シオリ
はい ! SageMaker Canvas を使用することで、ビジネスとテクノロジーのギャップを埋めることができ、機械学習のプロセス全体がより連携され、効率的になります。
専門家とビジネスユーザーが独自のモデルを簡単に共有、改善、そして適用できる環境が提供されるため、知識不足によるアイデアの損失を防ぐことができます。
Amazon SageMaker Canvas の強み
米倉 裕基
SageMaker Canvas が専門知識の有無に関わらず、機械学習モデルの作成や予測を可能にするツールであることがよくわかりました。
ここからは、さらに踏み込んで SageMaker Canvas の強みについてお伺いしたいと思います。
シン シオリ
そうですね。
SageMaker Canvas は多岐にわたる機能がありますが、「利用開始の容易さ」、「多様なユースケースへの対応」、そして「AWSサービスとの高い親和性」の 3 点が主な強みとして挙げられると思います。
米倉 裕基
「利用開始の容易さ」とは、先ほどご説明いただいた通り、数クリックで機械学習モデルを構築できるというような点を指していますか ?
シン シオリ
はい。このように容易に利用を開始できるのは、SageMaker Canvas がさまざまなユースケースの機械学習モデルをデフォルトで提供しているからです。
すぐに使用できる機械学習モデルとしては、感情分析、画像内の物体の検出、画像内のテキストの検出、エンティティの抽出、言語の検出、個人情報の検出、費用分析、身分証明書の分析、ドキュメント分析まで、ほとんどの機械学習のタスクをカバーしています。
すぐに使えるモデル
(クリックすると拡大します)
米倉 裕基
思いつく限りの機械学習モデルが初めから網羅されている感じですね !
シン シオリ
SageMaker Canvas では、自然言語処理やコンピュータビジョンの機械学習モデルの場合、背後で AWS の AIサービスを活用しています。
例えば、画像認識であれば Amazon Rekognition、自然言語処理であれば Amazon Comprehend、テキスト抽出であれば Amazon Textract といった感じですね。
米倉 裕基
なるほど ! AWS の豊富な AI サービスを背後で活用することで、多彩な機械学習モデルが提供できるというわけですね。
シン シオリ
はい。それに、デフォルトの機械学習モデルに加えて、独自のデータを使った、カスタム分類、リグレッション、時系列予測、テキスト分類、画像分類など、さまざまなユースケースに対応する独自のカスタムモデルを構築することもできます。
さまざまなモデル
(クリックすると拡大します)
米倉 裕基
あらかじめ用意されたモデルを選んで使うこともできるし、独自のモデルをカスタマイズして作ることもできるわけですね。
本当に機械学習初心者から上級者まで幅広いユーザーに対応したサービスといった感じですね。
シン シオリ
はい。このターゲットユーザーの幅広さにおいても、SageMaker Canvas の「機械学習の民主化」の理念が行き届いていると思います。
Amazon SageMaker Canvas の多様なユースケース
米倉 裕基
もう一つの強みである「多様なユースケースへの対応」についてお聞きできますでしょうか。
SageMaker Canvas の利用に適した業界や利用シーンなどを教えてください。
シン シオリ
SageMaker Canvas は業界を問わず多くのユースケースに適用可能です。具体的に言えば、カスタマーサポートの分野であれば、お客様のテキストからポジティブ、ネガティブ、ニュートラル、さらにそれらの複合的な感情を自動で抽出するモデルを構築できます。
また、セールスやマーケティングの分野では、売上やコンバージョン率、顧客の解約率などを事前に予測するモデルも構築可能です。
米倉 裕基
なるほど。
感情分析や販売動向を把握し、マーケティング戦略の確立に役立てるわけですね。
シン シオリ
それに、金融や会計の分野であれば、クレジットスコアを計算したり、支払いが遅延する可能性、さらには不正な取引を自動で検出するような用途にも使えます。
さらに、健康診断データから未来の健康リスクを予測するような医療分野での適用例もあります。
小売業で言えば、商品の需要予測や在庫管理、配達時間の最適化といった、物流に関連する課題にも対応できます。
多様なユースケース
(クリックすると拡大します)
米倉 裕基
リスク評価から物流まで、ほんとうに多角的に活用できるんですね。
シン シオリ
はい。SageMaker Canvas を使えば、業界を問わず、簡単に機械学習モデルを構築して、ビジネスに直結した予測や解析が行えます。
多くの業界でよく使われるテンプレートが最初から用意されているので、導入の敷居が低いことも魅力の一つです。
米倉 裕基
主だったモデルをプリセットで利用できるわけですもんね。
これまで技術面や人材面の不足が障害となっていた企業にとって、SageMaker Canvas の手軽さや対応できるユースケースの広さは、機械学習の導入を検討する良い機会になりそうです。
シン シオリ
まさにその通りです。
SageMaker Canvas を使えば、プログラミング知識がなくても、ドラッグアンドドロップ式のインターフェースで簡単にモデルを作成できます。そのため、企業はより迅速にデータ駆動の意思決定を行えるようになると思います。
従来数週間かかっていた分析が、SageMaker Canvas を使うことで数時間で済むということもありえるでしょうね。
AWS サービスとの連携
米倉 裕基
続いて、最後に強みとして挙げていただいた「他の AWS サービスとの親和性の高さ」という点をご説明いただけますでしょうか。
シン シオリ
機械学習において、「データ」は極めて重要です。データの質と量が不十分であれば、モデルの性能は最大限に発揮されません。
その点、SageMaker Canvas は AWS の広範なエコシステムとの連携が可能なため、データの収集、前処理、分析、モデル訓練、そして運用まで、一元的かつシームレスに行えます。
米倉 裕基
他の AWS サービスと緊密に連携することで、AWS エコシステム内でデータを最大限に活用できるわけですね。
シン シオリ
はい。
例えば Amazon S3 や Amazon RDS などに保存されたデータを、SageMaker Canvas で解析やモデル訓練の素材として活用できます。
米倉 裕基
なるほど。
具体的には、どうやって SageMaker Canvas で他の AWS サービスからデータを収集するんでしょうか?
シン シオリ
データ収集自体はとても簡単で、特別なコードを書く必要はありません。
SageMaker Canvas のインターフェース上で、「データソース」として選択した AWS のストレージやデータベースからデータを取り込むことができます。
米倉 裕基
UI から直接データソースを指定できるんですね。
シン シオリ
はい。他にも Amazon Athena でクエリされる構造化・非構造化データ、Amazon Redshift に格納されているビジネスデータなども、SageMaker Canvas で効率的に分析やモデル訓練に活用できます。
米倉 裕基
多様なサービスをデータソースとして活用できるんですね。
シン シオリ
はい。
ちなみに、「データソース」を選択する際には、AWS Identity and Access Management (IAM) によってアクセス権が設定されたデータソースのみが表示されます。このため、ユーザーは自分がアクセスできるデータソースからのみデータを取り込めます。
他サービスとの連携
(クリックすると拡大します)
米倉 裕基
つまり、IAM によってアカウントレベルでアクセス可能なデータソースがフィルタリングされるわけですね。
シン シオリ
その通りです。データソースのアクセス制御は、セキュリティの観点からも非常に重要ですからね。
米倉 裕基
ふむふむ。
それでは、データソースを効率的に管理する以外に、連携のメリットとして何がありますか?
シン シオリ
そうですね。コラボレーションの強化は特に重要なメリットだと思います。
先ほども触れたように、SageMaker Studio で作成したモデルを SageMaker Canvas で共有することができるので、データサイエンティストとビジネスアナリストが更に効率的に協力できる環境を提供できます。
米倉 裕基
なるほど。そのようにして、機械学習の専門家と非専門家が、一緒に ML モデルを作成したり、共有したりすることができるわけですね。
シン シオリ
はい。加えて、SageMaker Canvas で生成した ML 予測の結果を BI サービスの Amazon QuickSight に送信することで、高度な可視化が可能です。グラフ化することで、そこから強力なビジネスインサイトを得られるようになると思います。
米倉 裕基
確かに! ビジネスユーザーにとっても、グラフ化した予測を確認することで、より解像度の高いアイデアが生まれそうですね。
Amazon SageMaker Canvas の利用料金
米倉 裕基
ここまで、SageMaker Canvas の概要や強みについてご紹介いただいたわけですが、実際利用を始める際には利用料金はとても気になるところだと思います。
SageMaker Canvas の料金体系についてお教えいただけますでしょうか ?
シン シオリ
はい。基本的に、SageMaker Canvas の料金は主に 3 つの要素で構成されています。
米倉 裕基
3 つの要素ですか。
シン シオリ
第一に、「セッション料金」と呼ばれるものがあります。SageMaker Canvas のワークスペースにログインしている時間に基づいて課金される料金です。そのため、ワークスペースを利用していない時間もログイン状態であれば課金されます。
Amazon SageMaker Canvas
の料金ページ
米倉 裕基
おお、それは注意が必要ですね。実際に利用していなくても、ログイン状態が続くとセッション料金が発生するわけですね。
シン シオリ
その通りです。ですから不要な課金を防ぐためにも、利用していない時間はログアウトすることが推奨されています。
米倉 裕基
ふむふむ、SageMaker Canvas の利用料金を低く抑えるコツというわけですね。
それでは 2 つ目の要素はどういったものになりますか ?
シン シオリ
第二の要素としては、「すぐに使用できるモデル」の従量課金があります。
「すぐに使用できるモデル」は、裏で Amazon Rekognition や Amazon Comprehend、Amazon Textract などの AWS の AI サービスが活用されているため、その分の利用料金が課金されます。
米倉 裕基
プリセットで提供されている ML モデルのことですよね。
シン シオリ
はい。
例えば、画像内の物体検出や画像内のテキスト検出のリクエストは、データセット内の画像の数に基づき、Amazon Rekognition の料金体系 に従って課金されます。
また、感情分析、エンティティ抽出、言語検出、個人情報検出のリクエストは、100 文字単位で測定され、データセットのユニット数に基づき、Amazon Comprehend の料金体系 に従って課金されます。
米倉 裕基
背後で既存の AI サービスを利用するわけだから、その分の料金が発生するというわけですね。
シン シオリ
そうです。
最後に、第三の要素としてカスタムモデルの作成と運用にかかるリソースの使用料です。例えば、モデルのトレーニングや予測の生成に使われる計算リソースの種類と時間に応じて課金される料金ですね。
米倉 裕基
なるほど。独自の ML モデルの生成にかかるインスタンスやストレージなどの利用料金ですね。
こうして伺うと、SageMaker Canvas の料金体系は基本的に使用量に応じた従量課金制ということですね。
シン シオリ
その通りです。特に初期費用などはかからない従量課金制なので、ビジネスの規模やプロジェクトのフェーズに応じて柔軟にコストを最適化することが可能です。
米倉 裕基
初期費用がかからないのは、始めやすくていいですね。
ただ、従量課金制なので、リソースの使いすぎには注意が必要といった感じでしょうか。
シン シオリ
確かに、その点は注意が必要です。
特に、モデルのトレーニングやデータの大量処理が必要な場合は、その分費用も増加する可能性があるので、予期しないコストを避けるためにもしっかりとしたモニタリングと管理が求められます。
利用料金について詳しくお知りになりたい場合は、SageMaker Canvas の「料金ページ」をご覧ください。
Amazon SageMaker Canvas の参考資料
米倉 裕基
最後にお聞きしたいのですが、実際に SageMaker Canvas を使い始めたいと考えているユーザーに参考になる資料はありますか?
シン シオリ
そうですね。これから利用を始めるなら、「AWS Hands-on for Beginners」シリーズの SageMaker Canvas 入門ハンズオン動画 を見ながら試すのをおすすめします。
SageMaker Canvas 入門ハンズオン
米倉 裕基
シンさんが作成されたハンズオンですね。
おお、SageMaker Canvas の概要から、環境構築、実際のモデルの作成まで網羅されているんですね!
シン シオリ
はい。このハンズオンでは、「携帯電話会社で顧客の解約を防ぐ」という実際のビジネス課題に挑戦します。
サンプルデータを用いて、プログラミングなしで機械学習モデルを作成し、顧客の解約を事前に予測する方法をご紹介しています。
米倉 裕基
なるほど。具体的なシナリオがあると、ハンズオンがより現実的に感じられてより実践的になりそうですね。
シン シオリ
米倉 裕基
SageMaker Canvas では、専門家と非専門家が一緒にモデルを構築するプラットフォームとしての利用が有益と言うお話しでしたもんね。
せっかく SageMaker Canvas を利用するなら、コラボレーションの仕方についてはぜひとも理解したいところですね。
シン シオリ
それから、今年の 3 月に追加されたカステムテキストおよび画像分類のモデルに興味がある方は、こちらの AWS ブログ を参照してください。
米倉 裕基
新機能の紹介ブログですか !
SageMaker Canvas では、今後も新しい機能が追加される予定なんでしょうか。
シン シオリ
はい。2021 年末に公開されて以来、SageMaker Canvas は多くのアップデートを行い、ユーザーからのフィードバックに応えながら進化を続けてきました。具体的には、データソースの種類を増やし、モデルの共有や導入が容易になるような新しいコラボレーション機能を追加したり、すぐに使える自然言語処理とコンピュータビジョンのモデルも増やして、より手軽に高度なタスクが実行できるようになっています。
これからも、ユーザーの要望に応じてサービスを逐次改善していく予定です。
米倉 裕基
現時点ですでに、機械学習に馴染みのないユーザーでもコード不要で簡単に機械学習を実行できる環境が提供されているわけですけど、今後もユーザーの要望に耳を傾けながら、さらなる進化を続ける予定ということですね。
まとめ
米倉 裕基
これで、第 6 回「ナカの人に聞いてみた」のインタビューは終了になります。
おかげさまで、SageMaker Canvas がどのようなサービスなのか非常によくわかりました。
私もまずはハンズオンから始めて、SageMaker Canvas を用いた機械学習にデビューしてみたいと考えています。
最後に、シンさんから読者のみなさんにお伝えしたいことがあればお聞かせいただけますでしょうか。
シン シオリ
はい ! 初めに述べた通り、私は「機械学習の民主化」というビジョンに強く共感し、AWS の AI/ML サービス、特に SageMaker Canvas の普及を積極的に推進しています。
今日のインタビューで触れたように、SageMaker Canvas を使用することで、専門的な知識や技術がなくても機械学習を活用したアイデアを具現化できる環境が提供されます。
このように考えると、機械学習を簡単に活用でき、仕事やプライベートで AI のメリットを享受できる日が近いように感じませんか ? 機械学習がより身近になる未来を想像すると、非常にわくわくします !
読者の皆さん、米倉さん、本日はどうもありがとうございました。
米倉 裕基
シンさん、改めまして本日はありがとうございました !
本シリーズのその他の記事はこちら
- 選択
- AWS の位置情報サービスでリッチなマップを実装しよう !
- Amazon Kinesis Video Streams で監視カメラシステムを構築しよう!
- Amazon CodeCatalyst で開発環境の構築とチームコラボレーションを加速しよう!
- エンタープライズ検索サービス Amazon Kendra で知りたい情報をすぐに検索 !
- クラウドコンタクトセンターを簡単セットアップ !
参加者プロフィール
米倉 裕基
アマゾン ウェブ サービス ジャパン合同会社
テクニカルライター・イラストレーター
日英テクニカルライター・イラストレーター・ドキュメントエンジニアとして、各種エンジニア向け技術文書の制作を行ってきました。
趣味は娘に隠れてホラーゲームをプレイすることと、暗号通貨自動取引ボットの開発です。
現在、AWS や機械学習、ブロックチェーン関連の資格取得に向け勉強中です。
シン シオリ (Xiaoli Shen)
アマゾン ウェブ サービス ジャパン合同会社
ソリューションアーキテクト
ドイツと日本でソフトウェアエンジニアとして、大規模ウェブサービスとアプリを開発してきて、現在は AWS ソリューションアーキテクトとして DNB のお客様にご支援しています。
機械学習をフォーカスしてテックコミュニティ活動も行っています。
趣味はボルダリングです。
AWS を無料でお試しいただけます