投稿日: Aug 3, 2022

Amazon Comprehend を使用すると、モデルをトレーニングするための注釈の要件が軽減されるため、カスタムエンティティ認識を簡単に開始することができます。Amazon Comprehend は、テキストからキーフレーズ、コンテキストエンティティ、イベント、センチメントを抽出するための API を備えた自然言語処理 (NLP) サービスです。エンティティとは、ドキュメントに記載された人、場所、組織、クレジットカード番号などを指します。Amazon Comprehend のカスタムエンティティ認識 (CER) を使用すると、少しの簡単な手順で、ビジネスに固有のエンティティに基づいてモデルをトレーニングできます。モデルを効果的にトレーニングできる程度の詳細情報を提供するだけで、ほぼすべての種類のエンティティを識別できます。

これまで、Amazon Comprehend カスタムエンティティ認識エンジンをトレーニングするには、エンティティあたり最低 250 個のドキュメントと 100 個の注釈が必要でした。今後は、Amazon Comprehend カスタムエンティティ認識モデルをトレーニングするための最小要件を、エンティティタイプあたり 25 個の注釈まで削減します。改善されたモデリングを内部で使用して、3 つ程度の注釈付きドキュメントを試すことから始め、その都度結果を分析し、注釈とドキュメントを追加しながら繰り返し試していけるようになりました。低減された下限値は、プレーンテキストドキュメントのカスタムエンティティ認識モデルにのみ適用されます。

詳細と開始方法をお知りになるには、Amazon Comprehend の開始についてのブログ投稿製品ページ、またはドキュメントにアクセスしてください。