Amazon Web Services ブログ

Bridgeman Images は Amazon Translate を使用してグローバルに事業を確立

多くの企業は、新規顧客を獲得し成長を加速させるために世界規模で拡大することを目指しています。Bridgeman Images の場合、これは英語以外の言語を話す顧客を引き付けることを意味しました。手作業で翻訳しただけでは十分なスピードや費用対効果が得られないため、同社は言語の壁を克服するためのスケーラブルなソリューションを必要としていました。Amazon Translate を使用して、コンテンツのローカライズに必要な時間を数か月から数週間に短縮し、5 億 7000 万の英語の文字をイタリア語、フランス語、ドイツ語、スペイン語に翻訳しました。

Bridgeman Images は、アーカイブ内に 300 万近くのアクティブアセットを保有する権利管理型のイメージライセンス会社です。自社サイトで簡単に検索できるように、これらの各アセットには、タイトル、説明、および Amazon Elasticsearch Service (Amazon ES) にインデックス付けする一連のキーワードや媒体が含まれています。同社の調査によると、すべてのプラットフォームで集計した顧客の 20~30% が、英語以外のイタリア語、フランス語、ドイツ語、スペイン語のいずれかの言語で画像データを表示する必要があることが分かりました。そこで同社は、顧客に可能な限り最高の体験を提供するために、すべてのメタデータを翻訳することにしました。

Bridgeman Images はさまざまな数多くの選択肢を研究し、機械翻訳が彼らのビジネスに全体的に最高の価値をもたらすだろうと判断しました。新しい翻訳の準備をするとき、同社はその機会に内部のメタデータ構造を見直し、重複を最小限に抑えて翻訳コストを節約する堅牢なワークフローを実行することにしました。

同社は最初にキーワードシステムを更新しました。キーワードシステムもともとはセミコロンで区切られたレコードを持つフラットなデータ構造として作成されたものでした。同社はこれらのエントリーの重複を排除し、複数のアセットがその翻訳と同時にキーワードを共有できるようにするリレーショナル構造を作成しました。キーワードは Amazon RDS MySQL インスタンスに保存され、キーワードへの変更がトリガーされるかシステムに新しいキーワードが入力されるたびに Amazon Elasticsearch Service インデックスに反映されます。

キーワード (およびその他のデータ) の翻訳を処理するために次に行った作業は、Python、Boto3 や Zappa と共に AWS Lambda にデプロイされた Flask API を使用して、Amazon Translate サービス用の単純なラッパーを作成することでした。

その後、システムに新しいキーワードが追加されるたびにタスクが RabbitMQ クラスターのキューに入れられるようにトリガーを設計しました。これにより、ワーカーを呼び出して AWS Lambda 関数をクエリして Amazon Translate から翻訳を取得しました。

次に、タイトルと説明からなる 7 億文字近くのデータを 4 つの異なる言語に一括翻訳する必要がありました。一部のソースメタデータは複数の言語で記述されているため、Amazon Comprehend を使用して Lambda 翻訳機能を拡張して元の言語を検出しました。

この大量のデータを効率的に処理して変換するために、Bridgeman Images は、AWS でホストされている RabbitMQ クラスターと、AWS Elastic Beanstalk でデプロイされた Docker コンテナ内でワーカーリスナーを実行する Amazon EC2 インスタンスの AWS Auto Scaling スタックを利用しました。この設定により、1 時間あたり約 14,000 のアセットを処理でき、各アセットの平均翻訳量は約 100〜300 文字でした。

「当社は合計約 15 日間のスパンで 1 言語あたりおよそ 5 億 7000 万文字を翻訳しました。そのおかげで時間が大幅に短縮されました。おそらく、AWS が提供する既存のテクノロジインフラストラクチャを構築して簡単に統合するには、数週間だったのに対して数か月かかったことでしょう。開発サイクル、特にリファクタリングは、それを実行するために 1 週間に 1 人の開発者を要しただけだったので非常に短く、当社はリソースを積み重ねたり開発者に新たなスキルを身につけさせたりする必要はありませんでした」と Bridgeman Images の IT ディレクターである Sean Chambers 氏は述べています。

最後に、進行中の翻訳をサポートするために、Bridgeman Images は、チームがメタデータを入力できる、新たに構造化されたカタログ作成インターフェイスを設計しました。それにより、単純にソース言語 (例えば英語) を入力すれば、システムがイタリア語、ドイツ語、フランス語、そしてスペイン語に自動翻訳するようにしました。これらはキーワードトリガーのキューと同様のキューに入れられます。検索可能になるように、それらは定期的に Amazon Elasticsearch Service インデックスに反映されます。

これが、Bridgeman Images が Amazon Translate を使用して顧客にリアルタイムの翻訳を提供する方法を示したシンプルなアーキテクチャです。

「私にとって、Amazon Translate を選択した理由の 1 つはコストでした。当社が検討していた他の競合会社よりも 40% コストを節減できました」と Bridgeman Images の IT ディレクターである Sean Chambers 氏は述べています。

こちらが Bridgeman Images サイトのプレビューです。


著者について

Shafreen Sayyed は、ロンドンを拠点とする AWS のソリューションアーキテクトです。彼女は、イギリスとアイルランド各地のお客様を支援し、さまざまな業界の業種をサポートしてビジネスを変革し、業界をリードするクラウドソリューションを構築しています。彼女は機械学習と人工知能に特に興味を持っており、お客様がこれらの新しくエキサイティングな技術をビジネスのあらゆる面に統合するのを容易にする方法を見つけることに情熱を傾けています。