Amazon Comprehend は、機械学習を使用してテキストから洞察を見つける自然言語処理 (NLP) サービスです。Amazon Comprehend は、Custom Entity Recognition、カスタム分類、キーフレーズ抽出、感情分析、エンティティ認識などの API を使用することにより、お使いのアプリケーションに自然言語処理を簡単に統合できます。Amazon Comprehend API をお使いのアプリケーションに読み込むだけで、ソースとなるドキュメントやテキストの場所がわかります。API は、エンティティ、キーフレーズ、感情、言語を、アプリケーションで使用できる JSON 形式で出力します。

Custom Entity Recognition

Custom Entity Recognition を使用すると、Amazon Comprehend をカスタマイズして、ドメインに固有の用語を識別できます。Comprehend は、AutoML を使用して、少量の例 (例えば、ポリシー番号、請求番号、または SSN のリストなど) から学習し、機械学習を必要とせずに、PDF、プレーンテキスト、または Microsoft Word ドキュメント内の他のテキストブロック内の請求番号などの用語を認識するように、プライベートなカスタムモデルをトレーニングします。 詳細については、このドキュメントページをご覧ください。 

カスタム分類子

カスタム分類子 API を使用すると、ML を学習することなく、ビジネス特有のラベルを使用してカスタムのテキスト分類モデルを簡単に構築できます。たとえば、カスタマーサポート組織はカスタム分類子を使用して、顧客がどのように問題を記述したかを元に、インバウンドリクエストを問題のタイプで自動的に分類できます。  カスタムモデルを使用すると、ウェブサイトのコメントの調整、お客様からのフィードバックのトリアージ、ワークグループドキュメントの整理が簡単にできます。詳細については、このドキュメントページをご覧ください。

エンティティ認識

エンティティ認識 API は、提供されたテキストに基づいて自動的に分類される、名前付きエンティティ (「人」、「場所」、「位置」など) を返します。 詳細については、このドキュメントページをご覧ください。

  • サンプルテキスト: Amazon.com, Inc. はワシントン州シアトルにあり、1994 年 7 月 5 日にジェフ・ベゾス氏によって設立されました。顧客は書籍からブレンダーまであらゆるものを購入できます。シアトルはポートランドの北、ブリティッシュコロンビア州バンクーバーの南にあります。シアトルに本拠を置くその他の有名企業は、スターバックスとボーイングです。

    エンティティ カテゴリ 信頼性
    Amazon.com, Inc.
    組織 0.96
    ワシントン州シアトル ロケーション 0.96
    1994 年 7 月 5 日 日付 0.99
    ジェフ・ベゾス 0.99
    シアトル
    ロケーション 0.98
    ポートランド
    ロケーション 0.99
    ブリティッシュコロンビア州バンクーバー ロケーション 0.97
    スターバックス
    組織 0.91
    ボーイング
    組織 0.99

感情分析

感情分析 API は、テキストの全体的な感情 (肯定的、否定的、中立的、または混在) を返します。 詳細については、このドキュメントページをご覧ください。 

Targeted Sentiment

Targeted Sentiment は、テキスト内のエンティティに対する感情 (肯定的、否定的、中立的、または混在) を識別することで、より詳細な感情のインサイトを提供します。詳細については、このドキュメントページをご覧ください。

PII 識別とリダクション

Amazon Comprehend の機械学習機能を使って、顧客の電子メール、サポートチケット、製品レビュー、ソーシャルメディアなどに含まれる個人を特定できる情報 (PII) を検出し、リダクションします。機械学習の経験は必要ありません。例えば、サポートチケットやナレッジ記事を分析して PII エンティティを検出し、検索ソリューションにドキュメントをインデックスする前にテキストをリダクションすることができます。その後、検索ソリューションでは、ドキュメントに PII エンティティが含まれないようにします。PII エンティティをリダクションすることで、プライバシーを保護し、現地の法律や規制を遵守することができます。 詳細については、このドキュメントページをご覧ください。

毒性検出

Comprehend の毒性検出は、テキストベースのドキュメントに含まれる有毒な内容を検出するためのシンプルな NLP ベースのソリューションを提供します。この機能は、オンラインプラットフォームでのピアツーピアの会話や、生成系 AI の入出力を調整するために、すぐに使用できます。詳細については、このドキュメントページをご覧ください。

迅速な安全分類

Comprehend には、入力プロンプトを有害か無害かに分類できるトレーニング済みの 2 分類機能が用意されています。これを統合することで、LLM が無害なコンテンツにのみ応答するようにできます。詳細については、このドキュメントページをご覧ください。

キーフレーズ抽出

キーフレーズ抽出 API は、キーフレーズまたは論点と、これがキーフレーズであることを裏付ける信頼性スコアを返します。 詳細については、このドキュメントページをご覧ください。

  • サンプルテキスト: 私は熱心な写真家です。主に、DSLR か、気軽に持ち歩けるインスタントフィルムカメラで撮影しています。能力と利便性で DSLR に勝るものはありませんが、インスタントフィルムカメラには魔法のようなものがあります。おそらくそれは、実際のフィルムで撮影していることや、撮影したすべてのショットが唯一無二の物理的な人工物であることかもしれません (写真がありふれたものである今日の Instagram や Facebook の世界では特殊なことです)。私が確かだとわかっていることは、それらの写真は信じられないほど楽しく利用でき、そのうちの 1 枚をパーティーで取り出すと人々の目が明るくなることです。

    キーフレーズ 信頼性
    熱心な写真家 0.99
    私の DSLR 0.97
    私のインスタントフィルムカメラ 0.99
    気軽に 0.99
    能力と利便性 0.94
    実際のフィルム 0.99
    すべてのショット 0.92
    唯一無二の物理的な人工物 0.99
    今日 0.91
    世界 0.99
    Instagram や Facebook 0.99

イベント検出

Comprehend Events は、ドキュメントからイベント構造を抽出し、何ページにもわたるテキストを簡単に処理できるデータに変換して、AI アプリケーションやグラフ可視化ツールで利用することができます。この API を使えば、大きなドキュメントセットに対して大規模に、「誰が」「何を」「いつ」「どこで」といった質問に、NLP の経験が以前になくても回答することができます。Comprehend Events を使用して、非構造化テキストで表現された実世界のイベントや関連するエンティティに関する詳細な情報を抽出します。 詳細については、このドキュメントページをご覧ください。 

言語検出

言語検出 API は、100 を超える言語で書かれたテキストを自動的に識別し、主要言語と、言語が主要であることを裏付ける信頼性スコアを返します。 詳細については、このドキュメントページをご覧ください。

構文解析

Amazon Comprehend Syntax API を使用すれば、お客様は、トークン分割や品詞 (PoS) を使用してテキストを分析したり、テキスト内の名詞や形容詞などの単語境界やラベルを識別したりできます。 詳細については、このドキュメントページをご覧ください。

トピックモデリング

トピックモデルは、Amazon S3 に格納された一連のドキュメントから、関連する用語またはトピックを識別します。コレクション内の最も一般的なトピックを識別し、それらをグループに整理し、次にどのドキュメントがどのトピックに属しているかをマップします。 詳細については、このドキュメントページをご覧ください。

多言語サポート

Amazon Comprehend は、次の言語のテキスト分析を実行できます。ドイツ語、英語、スペイン語、イタリア語、
ポルトガル語、フランス語、日本語、韓国語、ヒンディー語、アラビア語、中国語 (簡体字)、中国語 (繁体字) のテキストです。その他の言語でアプリケーションを構築する場合、顧客は Amazon Translate を使用してテキストを Comprehend がサポートする言語に変換した後、Comprehend を使用してテキスト分析を行うことができます。言語サポートの詳細については、ドキュメントのページを参照してください。

Amazon Comprehend の料金の詳細

料金ページにアクセスする
始める準備はできましたか?
サインアップ
ご不明な点がおありですか?
お問い合わせ