Amazon Web Services ブログ

AWS DeepComposer – 新機能付きで一般提供開始

AWS DeepComposer は、機械学習を始めるための独創的な方法で、AWS re:Invent 2019 のプレビューでローンチされました。本日、すべての AWS ユーザーが DeepComposer を利用できるようになり、新しい機能で拡張されたことをお知らせできることを大変嬉しく思います。

AWS DeepComposer 入門
AWS DeepComposer を初めて使用する場合は、以下の手順に従ってください。

  • AWS DeepComposer コンソールにログインします。
  • このサービスと、生成 AI の使用方法について学びます。
  • コンソールの仮想キーボード、または Amazon.com で注文可能な物理キーボードのいずれかを使用して、短い楽曲を録音します。
  • お気に入りのジャンルの事前トレーニング済みモデルを選択します。
  • このモデルを使用して、曲に基づいて新しいポリフォニックコンポジションを生成します。
  • コンソールでコンポジションを再生し、
  • コンポジションをエクスポートするか、SoundCloud で共有します。

次に、生成 AI をさらに簡単に使用開始できるようにする新機能を見てみましょう。

ラーニングカプセル
DeepComposer は、既存のデータセットから新しいサンプルを生成するために特別に構築されたニューラルネットワークアーキテクチャである Generative Adversarial Networks (別名 GAN、研究論文) を利用しています。GAN は、2 つの異なるニューラルネットワークを互いに対比させて、サンプル入力に基づいてオリジナルのデジタル作品を生成します。DeepComposer では、GAN モデルをトレーニングおよび最適化して、オリジナルの音楽を作成できます。

これまで、GAN のスキルの向上に関心のある開発者は、簡単に始める方法がありませんでした。ML や音楽のバックグラウンドに関係なくそういった開発者を支援するために、AWS は主要な概念を紹介する簡単な学習カプセルのコレクションと、GAN のトレーニングと評価の方法を構築しています。これには、ハンズオンラボと、GAN モデルを構築するためのステップバイステップの説明とコードが含まれます。

GAN に慣れたら、独自のモデルのトレーニングに進む準備が整います。

コンソール内トレーニング
機械学習コードを 1 行も記述せずに、DeepComposer コンソールで独自の生成モデルをトレーニングできるようになりました。

まず、GAN アーキテクチャを以下から選択します。

  • 「MuseGAN」、Hao-Wen Dong、Wen-Yi Hsiao、Li-Chia Yang、Yi-Hsuan Yang が制作 (研究論文Github)。MuseGAN は、音楽を生成するために特別に設計されています。MuseGAN のジェネレーターは、曲の大まかな表現を学習するための共有ネットワークと、個々の音楽トラックを生成する方法を学習するための一連のプライベートネットワークで構成されています。
  • 「U-Net」、Olaf Ronneberger、Philipp Fischer および Thomas Brox が制作 (研究論文プロジェクトページ)。U-Net は画像変換ドメインで大成功を収めており (冬の画像を夏の画像に変換するなど)、音楽の生成にも使用できます。これは MuseGAN よりも単純なアーキテクチャであるため、初心者が理解しやすくなっています。内部で何が起こっているのか知りたい場合は、この Jupyter ノートブックで U-Net アーキテクチャの詳細を学ぶことができます。

MuseGAN を使って、新しいモデルに名前を付けましょう。

次に、モデルをトレーニングするデータセットを選択するだけです。

オプションで、ハイパーパラメータ (つまり、トレーニングパラメータ) を設定することもできますが、今回はデフォルト設定を使用します。最後に、[Start training] をクリックすると、 AWS DeepComposer がトレーニングジョブを起動し、インフラストラクチャと機械学習のすべての設定を処理してくれます。

約 8 時間後、モデルがトレーニングされ、それを使用してコンポジションを生成できます。ここで、新しい「リズムアシスト」機能を追加できます。これは、入力中の音符のタイミングを修正し、音符がビートに同期するようにします。

開始方法
AWS DeepComposer は現在、米国東部 (バージニア北部) リージョンでご利用いただけます。

このサービスには、すべての AWS のお客様を対象とした 12 か月の無料利用枠が含まれるため、サンプルモデルを使用して 500 の楽曲を無料で生成できます。

無料利用枠に加えて、米国の Amazon.com からキーボードを注文し、それを DeepComposer コンソールにリンクすると、さらに 3 か月間無料トライアルが延長されます!

キーボードの下側の画像

AWS DeepComposer を試して、ご感想をお聞かせください。 フィードバックは、通常の AWS サポートの連絡先、または DeepComposer 用の AWS フォーラムからお寄せください。

– Julien