メインコンテンツに移動

builders.flash

日常で楽しむクラウドテクノロジー

AWS Summit Japan 展示「AI メイクさん」のウラガワ ! - AI エージェントで希望のメイク 3D モデルを作成

2025-11-04 | Author : 大野 綾太, 成瀬 大毅, 喜多悠

はじめに

みなさんこんにちは!AWS プロフェッショナルサービスの大野、成瀬、パートナーソリューションアーキテクトの喜多です。今回は 2025 年 6 月に行われた AWS Summit Japan - Builders Fair に出展した「AI メイクさん」で利用されている技術について詳細に解説していきます !

 


X ポスト »
| Facebook シェア » | はてブ »

builders.flash メールメンバー登録

builders.flash メールメンバー登録で、毎月の最新アップデート情報とともに、AWS を無料でお試しいただけるクレジットコードを受け取ることができます。

今すぐ登録 »

AI メイクさんとは ?

AI メイクさんはユーザーが試したいメイク (例 : K-pop アイドル風メイク、リップを赤くメイクする等) の要望を AI エージェントにチャット形式で伝えることで、実際に自分の顔に要望通りのメイクがされた 3D モデルを生成することができるアプリケーションです。「新しいメイクに挑戦したいけど、どんなメイクが似合うかわからない」「こんなメイクを試してみたいけど、時間とお金がかかって挑戦できない」「メイクが似合っているかいろんな視点から確認したい」といった課題を解決します。

1. 顔画像のアップロード

アプリケーション上で顔画像を撮影、または事前に準備した顔画像をアップロードします。

Missing alt text value

2. 3D モデル表示

顔画像のアップロードが完了すると、3D モデルが生成・表示されます。この 3D モデルはアプリケーション上で、ぐるぐると方向を変えて 360° から確認することができます。

Missing alt text value

3. AI エージェントとの会話

試しにメイクチャットで「季節に合ったメイクをお願いします」と入力して送信すると、AI エージェントはユーザーと自律的に会話をしてメイク生成に必要な情報を収集します。メイクを実行するのに必要な情報が揃ったと AI エージェントが判断すると、自動的にメイク済み 3D モデルの生成を開始します。

Missing alt text value

4. メイクの完了

20 秒ほどで生成が完了し、メイク済みの 3D モデルに更新されます。要望に沿ったメイクができているかどうかをいろんな角度から確認してみてください。

Missing alt text value

5. 追加のメイク要望

追加で要望がある場合はチャットを続け、納得いくまで微調整することが可能です。例えば、追加の要望として「リップをダークレッドにしてください」とチャットすると、AI エージェントがメイクの修正を実行します。しばらくすると、唇の色がダークレッドに修正された 3D モデルが表示されます。

Missing alt text value

6. メイクに関する質問

どんなメイクを試したいかわからない場合は、 AI エージェントに聞いてみましょう。例えば「何かおすすめのメイクはありますか ?」と質問すると AI エージェントがいくつかのメイクの例を挙げてくれます。

※ アプリケーションが出力した顔画像は AI によって生成されました。

Missing alt text value

AI メイクさんのアーキテクチャ全体像

機能の詳細

ここからは、AI メイクさんで実装されている機能について詳しく説明していきます!AI メイクさんで実装されている機能は主に以下になります。

  1. AI エージェント: ユーザーとの自然言語での対話を通じて、メイク済みの 3D モデルを生成するために必要な情報を収集するエージェントです。必要に応じて以下の Tool を自律的に実行します。

    a. メイクのトレンドを検索する Web Search Tool
    b. 要望のメイク画像を取得する Image Search Tool
    c. 要望のメイク画像がなかった場合に、生成 AI によって要望通りのメイク画像を生成する Gen Makeup Image Tool
    d. 3D モデル生成処理を実行する Gen 3D Makeup Model Tool

  2. メイク転写: Makeup Transfer を使用して、メイク画像からメイク成分だけを抽出し、ユーザーの顔画像に自然な形でメイクを転写します。

  3. 3D モデル生成: Gaussian Splatting を使用して、顔画像から 3D モデルを生成します。

1. AI エージェント

ユーザーの顔画像のアップロード後、AI エージェントは、ユーザーからのチャットの内容から、以下の 4 つの Tool を自律的に選択・活用して、ユーザーの要望に沿ったメイクを実施します。AWS がオープンソースで提供している AI エージェント開発用の SDK である Strands Agents を用いて実装しています。

Missing alt text value

1.a メイクのトレンドを検索する Web Search Tool

AI エージェントのみの知識では十分な情報がないと AI エージェントが判断した場合には、Web Search Tool を利用してウェブ上から関連する情報を取得します。実装方法としては Tavily MCP を利用しています。例えば、この機能はユーザーが「最新のメイクのトレンドを知りたい」といった要望をした場合に活用されます。ウェブから最新のメイク情報を収集し、AI エージェントはその情報を基にメイクアップ用プロンプトを生成します。このプロンプトは、1.c の Gen Makeup Image Tool のインプットとなります。

1.b 要望のメイク画像を検索する Image Search Tool

ユーザーの要望に沿うメイク画像をあらかじめ準備した画像から検索する Tool です。Amazon OpenSearch Service を使ってベクトル化したメイク画像の説明文に対し、ユーザーの要望をクエリとして検索を行います。要望に沿ったメイク画像が存在すれば対応する画像を取得して 1.d 3D モデル生成処理を開始します。メイク画像が見つからなければ、1.c の Gen Makeup Image Tool を使用してメイク画像を生成します。

1.c 生成AI によってメイク画像を生成する Gen Makeup Image Tool

ユーザーの要望を満たすメイク画像を画像生成 AI を用いて作成する Tool です。AI エージェントは、ユーザーとの対話を通して、ユーザーの要望に沿ったメイク画像を生成するためのプロンプト(例: ギャル風メイク → Japanese gyaru-style makeup to this exact face with matte foundation, dramatic winged eyeliner, ...)を作成します。同時に AI エージェントは、ユーザーの要望が顔全体に対するメイクか顔のパーツごとに対するメイクかによって画像生成に使用するモデルを選択し、Tool を実行します。顔画像全体のメイク画像生成には Amazon Bedrock を通じて、 Stable Diffusion 3.5 Large、顔のパーツごとのメイク画像生成には Amazon Nova Canvas の Inpainting 機能 を利用しています。

1.d 3D モデル生成処理を実行する Gen 3D Makeup Model Tool

1.a から 1.c の Tool を利用してメイク画像を準備することができたら AI エージェントはこの Tool を実行し、Step Functions で実装されている 3D モデル生成処理を実行します。3D モデル生成処理は大きく分けて、ユーザーの顔画像にこれまでの過程で取得したメイク画像からメイク情報を反映する Makeup Transfer と、複数枚の画像から 3D シーンを再構成する Gaussian Splatting があります。

2. メイク転写

ユーザーの顔画像にこれまでの過程で取得したメイク画像からメイク情報を反映するために Makeup Transfer という機械学習モデルを利用します。Makeup Transfer を用いることで、メイク画像からメイク成分だけを抽出し、ユーザーの顔画像に自然にメイクを転写することができます。これにより、顔のパーツの形が変化する等のノイズなしに自分の元画像に要望通りのメイクがされた顔画像を生成することができます。この機械学習モデルを Amazon EC2 にデプロイし、並列実行可能なAPIとして実装しました。Makeup Transfer は こちら の実装を参考にしました。
Missing alt text value

3. 3D モデル生成

3D モデル生成では、ユーザーの元画像がアップロードされた段階で元画像 3D モデル生成 (3.a) を実行します。その後、ユーザーからの要望があるたびにメイク済み 3D モデル生成 (3.b) を実行します。 

Missing alt text value

3.a 元画像 3D モデル生成

ユーザーが顔画像をアップロードすると、それをトリガーとして 3D Gaussian Splatting を用いて 3D モデルを生成します。Gaussian Splatting は、複数枚の画像から 3D シーンを再構成する最新の手法で、短時間でフォトリアルな 3D モデルを生成できるのが特長です(詳細は こちらの記事 をご覧ください)。AWS Summit ではデモにかかる時間を考慮して、1 枚の画像のみを撮影し、360° Image Generation 手法を用いて生成した 120 枚の 360 度画像を使って学習を行っています。動画や複数枚の写真を撮影することで、さらに高品質な 3D モデルの生成も可能です。Gaussian Splatting は こちら の実装を、360° Image Generation は こちら の実装を参考にしました。

3.b メイク済み 3D モデル生成

メイクの要望を反映した 3D モデルを高速で生成するために、メイク済み画像を用いて元画像 3D モデルから追加で学習を行います。この際、形状に関係するパラメータを固定し色情報のみを再学習することで、わずか 15 枚のメイク済み画像から短時間でメイクの情報を反映できます。この15 枚のメイク済み画像は 3.a で生成された 120 枚から抽出して並列に Makeup Transfer を適用して作成されます。この工夫により、120 枚の 360 度画像にメイクを行って再度メイク済みモデルを学習するのに比べ、処理時間を約 1/6 (約 2 分 → 20 秒) に短縮できました。

3D モデル生成の流れのイメージ

まとめ

いかがだったでしょうか ? Strands Agents を用いた AI エージェントや Amazon Bedrock、Makeup Transfer と Gaussian Splatting といった最新手法を活用することで、AI と対話して理想のメイクを実現する 「AI メイクさん」を実装することができました。

今後の展望としては、メイク画像の出来栄えをエージェント自身に判断させ、自律的に評価改善サイクルを実行させたり、具体的な化粧品とメイク画像を紐づけて化粧品単位でのメイクを実施するとともに化粧品のレコメンドをおこなうといったことが挙げられます。皆さんもここで紹介した技術を参考に面白いアプリケーションを作ってみてください。

筆者プロフィール

Missing alt text value

大野 綾太 / Ryota Ohno

アマゾン ウェブ サービス ジャパン合同会社
プロフェッショナルサービス AI/ML コンサルタント

2024 年 4 月に新卒でアマゾンウェブサービスジャパン合同会社に入社しました。普段は、生成 AI を含む AI/ML の技術や知識を生かしてお客様を支援しています。
LinkedIn

Missing alt text value

成瀬 大毅 / Daiki Naruse

アマゾン ウェブ サービス ジャパン合同会社
プロフェッショナルサービス  クラウドアプリケーションアーキテクト

2024年4月に新卒でアマゾンウェブサービスジャパン合同会社に入社しました。普段は、主に通信業界のお客様向けに、インフラ・アプリケーションの開発・構築支援を行っています。
LinkedIn

Missing alt text value

喜多悠 / Haruka Kita

アマゾン ウェブ サービス ジャパン合同会社
パートナーソリューションアーキテクト

2024 年 4 月に新卒でアマゾンウェブサービスジャパン合同会社に入社しました。普段は、システムインテグレーターのパートナー企業を中心にエンジニアの育成・技術支援を担当しています。
LinkedIn