Amazon Web Services ブログ

Reach plc は AWS を活用した AI 駆動の Guten により、インパクトのあるジャーナリズムを提供

本稿は 2025 年 7 月 31 日に公開された “Reach plc delivers impactful journalism with AI driven Guten powered by AWS” を翻訳したものです。


本稿は Reach plc のシニアデータサイエンティストである Lewis James とグループデータ・アナリティクスディレクターである Dan Taffler と共同執筆しました。

ニュースは目まぐるしいスピードで発生します。パブリッシャーは公開までのプロセスを加速するために、ビジネスプロセスを常に評価し、イノベーションを行っていく必要があります。この状況を変えることが、あるパブリッシャーのミッションとなりました。Amazon Web Services(AWS)を活用した独自の生成 AI プロダクトを作成し、ジャーナリストが倫理を守りながら、 刻一刻と変化するニュースの最前線に立ち続けることを支援しています。

ミッション

英国(UK)およびアイルランドで最大の商業・国・地域ニュースのパブリッシャーとして、Reach plc は数千人のジャーナリストを擁する社内編集チームを有しています。彼らは 120 以上のブランド(The Mirror, The ExpressDaily RecordManchester Evening NewsDaily Star など)をカバーし、読者に力を与え、啓発し、楽しませています。Reach は毎月、英国のオンラインの読者の 69%、そして最近設立された米国ブランド(The Mirror US など)を通じて米国のオンラインの読者の 11% にニュースを配信しています。

ジャーナリストが価値の高い、影響力のあるジャーナリズムに集中できるようにするミッションの一環として、Reach の Data Science チームは Guten を開発しました。Guten は Amazon Bedrock に実装された基盤モデルを活用したプロダクトで、記事タグの追加や記事コンテンツのドラフト作成など、手動で行っていた非中核なタスクを自動化します。

Guten プロダクトの起源

Guten プロジェクトは、Reach の基礎となるビジネス指標を深く考えることから始まりました。Reach は複数のシステムで行っている非中核的な手動によるタスク(記事へのハイパーリンクの追加や、異なる分析ツール間での様々な指標の組み合わせ)の時間を削減したいと考えていました。また、全ての Reach ブランドでの総ページビューを増やし、速報ニュースの公開時間を短縮したいと考えていました。

生成 AI がパブリッシャー業界の新たな戦略的転換点となる中、Reach は PoC から開始して活用を決定しました。これによりニュースルームとの深い協力関係が生まれ、ジャーナリストの日常業務を妨げる制約、ボトルネック、反復的なタスクを特定するために逆算して取り組みました。

ユーザーリサーチにより、Reach は 3 つの課題を特定しました:

  • 仕事を遂行する際に異なるツール間で頻繁にコンテキストの切り替えがあり、速報ニュースと記事のパフォーマンスに影響を与えている
  • 検索エンジン最適化(SEO)のバックリンクやシステム間でのコンテンツのコピーなど、反復的で複雑性の低いタスク
  • 現在のトレンド、話題の信頼性、情報源となるコンテンツの入手可能性に関する複雑な判断を、統計的な分析ではなく直感に頼っている を、統計的な分析ではなく直感に頼っている

Guten がゲームをどのように変えたか

その名前は、1448 年に印刷機を発明したドイツの金細工師で発明家のヨハン・グーテンベルクに由来しています。Guten は複雑さを抽象化し、データサイエンスと生成 AI へのアクセスを民主化します。Reach のジャーナリストは、プロンプトエンジニアリング、基盤モデルの選択、評価について心配する必要がありません。AI を理解するための追加の技術スキルを必要とせず、自分の役割で最も価値を付加することに集中できます。

The MirrorOK Magazine の数名の献身的なジャーナリストから始まり、Guten のパイロット運用は成功しました。その後の 1 年で迅速な改良を通じて拡大・展開され、Reach の他の出版物全体で採用されました。

Guten は、ニュースワイヤーの取り込み、ワイヤー記事の提案、記事アイデアの推奨、コンテンツ生成を含む Reach の編集ワークフローの全ての部分を最適化します。コンテンツ管理システム(CMS)や他のビジネスツールとも統合されています。Guten は速報ニュースのリリース速度を大幅に向上させ、公開時間を 9 分から 90 秒に短縮しました。

Reach の Content Hub では、専門のジャーナリストチームが複数の国・地域ブランド向けにトラフィックを促進するコンテンツを制作しています。Guten は Reach のコンテンツを取り上げ、同じ記事の全てのバージョンを最初から書き直すことなく、他の出版物のスタイルとトーンで書き直す機能を提供しています。

開始から 2 年で、Guten は 2024 年に 18 億以上のページビューの促進を支援しました。

Guten の AWS アーキテクチャ

Guten のアーキテクチャは、主要な AWS サービス(AWS Fargate Amazon Elastic Container Service (Amazon ECS)Amazon OpenSearch Service、Amazon Bedrock、AWS Step FunctionsAmazon Simple Storage Service(Amazon S3)など)を活用しています。

以下の手順は、Guten ユーザーの典型的なワークフローを説明しています:

  1. AWS Step Functions は、S3 バケットに保存されている人間が評価した記事の処理をオーケストレーションします
  2. 人間が評価した記事を使用して、Guten のモデルサービスは Cohere Embed v3 を使用してベクトル埋め込みを生成します。ベクトル埋め込みは、コサインやユークリッド類似度などの組み込みアルゴリズムでセマンティック検索をサポートする Amazon OpenSearch Service ナレッジベースに保存されます
  3. ジャーナリストは、AWS Fargate・Amazon ECS で実行されている Web アプリケーションである Guten UI を使用して、ドラフトを生成するためのソースコンテンツを選択します
  4. Guten のモデルサービスは、ナレッジベースを使用してターゲットとなる出版物から類似の記事を取得し、Amazon Bedrock のモデル(Anthropic の Claude Sonnet 4 など)を使用してドラフトを生成します
  5. ジャーナリストは生成されたすべてのコピーの human-in-the-loop レビューを実行し、必要な変更を加えてから、Guten UI を使用して最終記事をコンテンツ管理システムに公開します
Architecture diagram illustrating the key AWS services and components that make up the Guten application. Key processes and workflows in the diagram are numbered to denote user access to the application, API calls to Amazon Bedrock and Amazon OpenSearch Service as well as posting the finalized article to the content management system.

図 1:Guten AWS アーキテクチャ

責任ある AI を活用して採用を拡大

Guten の採用を拡大する際、Reach は安全性を指針原則としました。生成 AI は非常に有能で強力ではありますが、読者の信頼を損なうような誤った情報(ハルシネーション)を返したり、ブランドのスタイルを捉えていない言葉遣いをするなど、独特のリスクをもたらします。

Reach はモデル出力のハルシネーションを減らすために Guten を継続的に改善しています。ジャーナリストはこのリスクを理解し、モデル出力の間違いを特定して解決するメカニズムを支援しています。Guten は生成された全ての出力に対して human-in-the-loop レビューを促進するように設計されています。ジャーナリストは最終公開前にコンテンツを簡単に修正または変更できます。こうした仕組みによりビジネス全体での Guten の採用が加速されました。

パブリッシャー業界特有のもう一つのリスクは引用の忠実性です。引用部分が情報源と同一であるようにすることです。情報源を誤って引用することは重大な法的影響をもたらす可能性があるため、Guten の UI で引用の変更を検出した場合にユーザーに警告します。さらに、Guten のモデル評価には引用の忠実性のスコアリングが組み込まれており、情報源と生成された引用部分が異なる可能性を減らしています。

さらに Guten は情報源と生成されたテキストの両方のコピーから抽出されたエンティティの不一致を強調表示します。これらには、人、場所、日付などのカテゴリが含まれます。抽出されたエンティティの違いは、ハルシネーションを示している可能性があり、特別な注意が必要です。

ブランドスタイルの捕捉

120 以上の Reach のブランド固有の文体や編集方針を捉えることは、重要な技術的課題となっています。文体を不正確に捉えてしまうと、生成後に過度な編集が必要となり、記事の公開までの時間に悪影響を及ぼします。

以下は、Reach のブランドやコンテンツにおけるスタイルとトーンの違いの一部です:

  • 政治的傾向の完全なスペクトラム(The ExpressThe Mirror の間など)
  • 幅広いターゲット読者層— OK! Magazine のような出版物は有名人やエンターテインメントなどの特定のトピックに焦点を当て、In Your Area は地元のニュース、情報、コミュニティに焦点を当てています
  • アメリカのコンテンツは、アメリカの言語慣習に合わせてローカライズする必要があります

Reach のデータサイエンスチームは人間とルールベースの評価の両方を使用して、モデル出力を配信先のコンテンツに合わせて調整します。使用される評価は常に変化しており、継続的な実験のポイントとなっています。Guten はタイトルと記事本文の生成の両方で、コンテンツ固有のデータを活用してモデル出力を差別化します。Reach のジャーナリストからのフィードバックは緊密なフィードバックループを確立するために不可欠であり、責任ある AI の導入に必要な信頼関係を構築します。

現在、Guten はユーザーのフィードバックを提供する 3 つのメカニズムを提供しています:

  1. 見出しと記事生成のサムズアップ/ダウンのフィードバックは、モデルのバリエーションを分割テストする際のユーザー満足度のシグナルとして機能します
  2. ジャーナリストは、特定の生成された記事に対してテキストベースのフィードバックを提供できます
  3. ユーザーは UI を通じてバグと製品機能リクエストの両方を直接送信でき、長期的に Guten の改善に役立ちます

絶え間ない革新と進化

ニュースは決して休むことがなく、Reach も Guten の機能を革新し進化させ続けています。Reach は以下の機能を積極的に開発しています:

  • 生成 AI を使用したコンテンツ推薦により、ワイヤーコンテンツ、出版物、ジャーナリストのマッチングにかかる時間を節約
  • SEO パフォーマンスを向上させるための画像推薦と選択の最適化
  • オーガニックページビューに影響を与えるソーシャルメディアチャネルの最適化とオーケストレーション

結論

Guten はデータサイエンス、データエンジニアリング、従来のソフトウェアエンジニアリング技術(AWS サービスを活用)の適用を Reach の編集プロセスと統合しています。彼らはコンテンツの公開に至るまで、更には異なるブランドやコンテンツ間でも、プロセスを正確に加速することができます。編集プロセスから逆算し、ユーザーフィードバックを深く理解することで、Reach は生成 AI を活用し、ジャーナリストが倫理的に影響力のあるジャーナリズムを提供できるよう支援し続けています。

パブリッシャーのワークフローを強化するAWS のメリットについては、AWS の Media & Entertainment 業界の担当者に連絡して詳細をご確認ください。

参考文献 

翻訳はソリューションアーキテクトの向井が担当しました。

Benjamin Le

Benjamin Le

Benjamin Le は AWS の通信、メディア、エンターテインメント、ゲーム、スポーツチームのソリューションアーキテクトで、パブリッシャーやインターネットサービスプロバイダーと協働しています。生成 AI(Generative AI)ソリューションを使用してお客様のビジネス変革の加速を支援しています。