AWS Startup ブログ

‘JSTOR’ はアラビア語で何と言いますか? ADRI がアラビア語学術文献を大規模に翻訳する方法

アリ・マズラーさんがオンラインでアラビア語の学術文献を入手することがいかに困難になり得るかを身をもって経験したのは、戦略研究の修士号を取得するためにニュージーランドのヴィクトリア大学ウェリントンで学んでいたときでした。国連 UNHCR 協会を通じてニュージーランドに再定住したイラン出身のマズラーさんは、自ら新しい未来を切り開こうと努力していましたが、研究を進めるために必要であった信頼性のある学術文献を入手することか極めて困難であることを知りました。アラビア語の学術的著作物の大半が印刷物でしか利用できなかったからです。マズラーさんは「これがこのアイデアを思いつくきっかけになったのです」と語りました。彼は、世界中の出版者がボタンを押すだけでアラビア語の学術的文献を共有し、利用できるプラットフォームを開発したいと決心しました。そのためには、学術研究が保存され、中東と北アフリカ全域に発信される方法を変える必要がありましたが、アラビア人学者たちが彼らの知識を世界的に共有できるよう支援するという目標は、それに値するものでした。

2014 年、マズラーさんは Arabic Digital Reform Institute という会社を立ち上げました。それからの 2 年間、ADRI は、研究しては開発するというサイクルを何度も繰り返しました。最初の大きな課題は技術的なものでした。ADRI は、「greenfield」スペースとして知られる、プロジェクトをサポートする既存の作業結果が全くないソフトウェア開発領域で作業を行っていました。プラットフォームに使用するためのオンラインのアラビア語学術的文献はほとんど存在しませんでした。マズラーさんは、「アラビア語の学術的文献の大半は、現在も印刷物のままです」と説明しています。そのような文献を入手してデジタル化する効率的な手段を見つけることは、重大な妨げとなっていました。

これらの技術的な課題のため、ADRI はプラットフォームを一から作り直すことをやめました。その代わり、マズラーさんと ADRI は、アラビア語学術的文献のための学術リポジトリを作成する方法を見つけるべく、オープンソース市場に進出し、研究機関アーカイブ向けにすでに広く使用されており、入手も簡単なソリューションである DSpace を見つけました。既存の技術アーキテクチャとデータモデルを導入することによって、ADRI は時間と経費を節約することができました。

しかし、言語面での課題がまだ数多く残っていました。既存のコンテンツ/文書管理システムは依然としてアラビア語の言語的特徴に対応しておらず、アラビア語の翻訳ツールも概して低レベルでした。2 年間試行錯誤した後、ADRI は、アラビア語テキストのためのカスタムメイドソリューションは ADRI のリソースには適していないという結論を出しました。これは ADRI にとって打撃ではありましたが、「チーム内の逆境力を養う助けになりました」とマズラーさんは言っています。ADRI は、自動化された翻訳エンジンを作成するために Amazon の翻訳サービスへのアクセスを活用して、それをプラットフォームに統合することに決めました。現在 ADRI は、英語を瞬時にアラビア語に翻訳するため、人口知能と Amazon Translate の自然言語処理を使用しています。このようなアラビア語の一括翻訳はユニークで、ADRI は今や自動翻訳における第一人者となりました。

ADRI のサービスとビジョンには大きな需要があり、アラビア語を話すコミュニティ全体に彼らのサービスを提供できることを確実にする国際的なパートナーのネットワークもすでに確立しています。ADRI の英語からアラビア語の翻訳済み文献の品質チェックを請け負うパートナーも取り集めています。ADRI はまた、2017 年の初めに、そのサービスを中東と北アフリカの後発途上国にある 14 の大学に提供するため、国際電気通信連合 (アラブ諸国) とのパートナーシップを締結しました。このパートナーシップは 2019 年の初めに開始され、2023 年まで継続する予定です。

ADRI は真の国際企業です。ニュージーランドのウェリントンを拠点とするこの会社の社員は、カイロ、ハンブルグ、およびロンドンで勤務しており、その中核となるチームは 12 の異なる言語を話します。マズラーさんはこのように語りました。「ADRI には、実験と思考の多様性を推奨する力強いサンドボックス文化があります。わたしたちの目標は、アラビア人学者がその成果を世界的に共有する支援をすることです。そうすることによって、ADRI は、わたしたちが中東の EdTech セクターにおける主要イノベーターであることを証明したいと思っています。」

原文はこちらです。

このブログの作者:ミシェル・クン – Michelle Kung

ミシェルは、AWSのスタートアップマーケティングチームに所属し、コンテンツ制作を率いています。AWSに参加する前は、Index Venturesのコンテンツリードとして活躍していました。それ以前には、The Wall Street Journalにおける貴社および編集者を経験、Huffington Postのビジネス記事編集者、THe Boston Globeの特派員、Publisher’s Weekでのコラムニスト、Entertainet Weeklyにおけるライターの経験を持っています。