Amazon Web Services ブログ

Amazon Comprehend 東京リージョン対応のお知らせ

みなさん、こんにちは。シニアエバンジェリストの亀田です。
Amazon  Comprehendが東京リージョンに対応しました。

Comprehendは、機械学習の経験は不要で、機械学習を使用してテキスト内でインサイトや関係性を検出する自然言語処理 (NLP) サービスです。

このサービスを用いて、構造化されていないデータのインサイトと関係を明らかにすることができます。テキストの言語を識別し、キーフレーズ、場所、人物、ブランド、またはイベントを抽出し、テキストがどの程度肯定的か否定的かを理解し、トークン分割や品詞を使用してテキストを分析し、テキストファイルのコレクションをトピックごとに自動的に整理します。Amazon Comprehend の AutoML 機能を使用して、組織のニーズに合わせて独自にカスタマイズされたエンティティまたはテキスト分類モデルのカスタムセットを構築することもできます。

従来オレゴンなど海外のリージョンですでに日本語対応がされていましたが、東京リージョンに対応したことにより、より使いやすくなりました。

How it works

マネージメントコンソールから簡単なデモが出来るようになっていますので、少しご紹介します。

1.[Launch Amazon Comprehend]を押します。

2.適当な日本語を入力し、[Analyze]を押します。このデモでは、[Built-in]を使いますが、[Custom]を用いることで、独自にテキスト分類モデルをカスタマイズすることができます。

結果として、この文章の解析が出力されます。複数のタブが用意されています。

Entities – ドキュメントで識別された人、場所、日付などのエンティティのリストを返します。文章の自動分類などに用います。

Key phrases – ドキュメントに表示される重要なフレーズを抽出します。たとえば、バスケットボールの試合に関するドキュメントは、チームの名前、会場の名前、最終スコアを返す場合があります。

Language – 文章の言語を推測します。

Sentiment – ドキュメントの感情的な感情を判断します。感情は、Positive、Neutral、Negative、またはMixedで出力されます。例えば攻撃的な言葉はNegative、愛情を語る「あなたがとても好きです。だからそんな悲しいことを言わないで。」という言葉はPositiveを返します。

Syntax – 現在日本語には非対応ですが、ドキュメント内の各単語を解析し、その単語の品詞を決定します。たとえば、「It is raining today in Seattle」という文では、「it」は代名詞として識別され、「raining」は動詞として識別され、「Seattle」は固有名詞として識別されます。

ハンズオンイベントのお知らせ

Comprehendに加えて、機械翻訳サービスの Amazon Translate、文字を音声化するAmazon Polly、音声を文字起こしするAmazon Transcribeを体験いただけるハンズオンイベントを開催します。もしよろしければ以下の日程のご都合のいい方にお越し下さい。

AWS Loft Tokyo 2020年3月11日 18:30 ~

AWS 目黒オフィス 2020年3月3日 13:30 ~

皆さんとお会いできることを楽しみにしています。

– シニアエバンジェリスト 亀田