Amazon Web Services ブログ

Nova Act IDE 拡張機能で AI エージェント開発を加速

9 月 23 日は、皆さんに Nova Act 拡張機能をご紹介したいと思います。この拡張機能は、IDE から離れずにブラウザ自動化エージェントを構築する過程を効率化するツールです。Nova Act 拡張機能は、 Visual Studio Code (VS Code)KiroCursor といった IDE に直接統合され、Nova Act モデルで自然言語を使用してウェブベースの自動化エージェントを作成するために役立ちます。

Visual Studio Code の Nova Act 拡張機能を簡単に見てみましょう。

Nova Act 拡張機能は、ブラウザ自動化エージェント SDK (ソフトウェア開発キット) である Amazon Nova Act SDK (プレビュー) を基盤に構築されています。Nova Act 拡張機能は、コーディング環境とテスト環境間のコンテキストスイッチを不要にすることで、従来のワークフロー開発を変革します。自然言語ベースの生成、アトミックセルスタイルの編集、統合されたブラウザテストなどの特徴量を使用して、本番環境レベルのエージェントスクリプトの構築、カスタマイズ、テストのすべてを IDE 内で行えるようになります。この統一されたエクスペリエンスにより、フォームの入力、QA の自動化、検索、複雑なマルチステップワークフローといったタスクの開発速度が向上します。

Nova Act 拡張機能の使用は、ワークフローを自然言語で記述して最初のエージェントスクリプトをすばやく生成することで開始できます。スクリプトは、ノートブックスタイルのビルダーモードを使用してカスタマイズし、API、データソース、認証を統合してから、実環境状況をシミュレートするローカルテストツール (長期的なマルチステップワークフローのライブステップバイステップデバッグなど) で検証します。

Nova Act 拡張機能の使用を開始する
まず、IDE の拡張機能マネージャーから Nova Act 拡張機能をインストールする必要があります。

私は Visual Studio Code を使っているので、[拡張機能] を選択してから Nova Act と入力します。次に、この拡張機能を選択し、[インストール] を選択します。

使用を開始するには、API キーを取得する必要があります。そのため、Nova Act ページに移動して、手順に従って API キーを取得します。Cmd+Shift+P / Ctrl+Shift+P を使用してコマンドパレットを開き、[API キーを設定] を選択します。

API キーを入力したら、ビルダーモードを試すことができます。このモードはノートブックスタイルのビルダーモードで、複雑な自動化スクリプトをモジュラーセルに分割するため、各ステップを個別にテストしてデバッグしてから次に進むことができます。

ここでは、 Nova Act SDK を使用してエージェントを構築できます。右側には、ブラウザ内でのエージェントのアクションをプレビューするための [ライブビュー] パネルと、モデルの思考やアクションを含めた実行ログを監視するための [出力] パネルがあります。

Nova Act 拡張機能をテストするため、[すべてのセルを実行] を選択します。選択すると新しいブラウザインスタンスが起動し、与えられたプロンプトに基づいて動作します。

[フルスクリーン] を選択して、ブラウザの自動化がどのように機能するのかを確認します。

ビルダーモードのもう 1 つの便利な特徴量は、[出力] パネルに移動してセルを選択し、そのログを表示できることです。これは、作業を行っているセルをデバッグしたり、セル固有のログを確認したりするために役立ちます。

テンプレートを選択して開始することもできます。

ビルダーモードの使用以外に、Nova Act とチャットしてスクリプトを作成することもできます。これを実行するには、拡張機能を選択し、[Nova Act スクリプトを生成] を選択します。Nova Act 拡張機能が右側のパネルにチャットダイアログを開き、スクリプトを自動的に作成します。

スクリプトを作成し終えたら、[ビルダーモードを開始] を選択できます。ビルダーモードでは、Nova Act 拡張機能が Python ファイルの作成を助けてくれます。チャット機能とビルダーモードを切り替えることができるため、シームレスな統合が実現します。

チャットインターフェイスでは、次の 3 つのワークフローモードを利用できます。

  • 依頼: タスクを自然言語で説明して自動化スクリプトを生成
  • 編集: 生成されたスクリプトを実行前に改良またはカスタマイズ
  • エージェント: ワークフローを実行する AI エージェントを実行、監視、操作

コンテキストを追加して、アクティブドキュメント、指示、問題に関する情報や、エージェントが使用できる追加のモデルコンテキストプロトコル (MCP) リソースを提供したり、現在のウィンドウのスクリーンショットを提供したりすることもできます。こうした情報を提供することで、エージェントが自動化タスクの特定の要件を理解できるようになります。

Nova Act 拡張機能は、チャットに / を入力することでアクセスできる一連の事前定義済みテンプレートも提供します。これらのテンプレートは事前定義された自動化シナリオで、一般的なウェブタスク用のスクリプトをすばやく生成するために設計されています。

これらのテンプレート (@novaAct /shopping [my requirements] など) を使用して、ワークフローに合わせてカスタマイズされた Python スクリプトを作成できます。Nova Act 拡張機能は、リリース時点で次のテンプレートを提供しています。

  • /shopping: オンラインショッピングタスク (検索、比較、購入) を自動化
  • /extract: データ抽出を処理
  • /search: 検索と情報収集を実行
  • /qa: 品質保証とテストのワークフローを自動化
  • /formfilling: フォームとデータの入力タスクを実行

Nova Act 拡張機能をフルスタックのエージェントビルダーツール、つまり開発ライフサイクル全体の完全なエージェント IDE とすることによって、この拡張機能はエージェント開発ワークフローを変革してくれます。自然言語を使用したプロトタイプの作成、モジュラースクリプティングによるカスタマイズ、ローカルテストでの検証のすべてを IDE から離れることなく実行して、本番環境レベルのスクリプトを確保できます。

知っておくべきこと
留意事項は以下のとおりです。

  • サポート対象の IDE: リリース時点で Nova Act 拡張機能を利用できるのは、Visual Studio Code、Cursor、および Kiro ですが、さらなる IDE のサポートが予定されています。
  • オープンソース: Nova Act 拡張機能は Apache 2.0 ライセンスに基づいて提供されているため、コミュニティへの貢献やカスタマイズが可能です。
  • 料金: Nova Act 拡張機能は無料でご利用いただけます。

Nova Act 拡張機能は、IDE の拡張機能マーケットプレイスからインストールするか、GitHub リポジトリにアクセスしてドキュメントや例を入手することで使用を開始してください。

ハッピーオートメーション!
Donnie

原文はこちらです。