Amazon Web Services ブログ
機械学習によるメディアの社会的影響を読み解く
メディアが人々に利益をもたらすために最適化されていたとしたら? 考えを深めさせるこの疑問は、Harmony Labs のミッションの中核に存在しています。ニューヨーク市に本部を置く非営利団体である Harmony Labs は、メディアが社会に与える影響をより良く理解し、メディアシステムの改革と変革のためのコミュニティとツールを構築するよう尽力しています。
Harmony Labs のエグゼクティブディレクターである Brian Wanieswki 氏は次のように述べています。
「私たちが現在利用しているメディアシステムは、功罪はいずれにせよ、怒りを生み出し、選別するマシンと化しており、同じような考えを持つ人々がグループ化されています。これらのシステムのビジネスインセンティブ構造は、怒りが多いほど、利益が増えるようなものとなっています。近年、世界中の政治的な事象は、これらのメディアシステムが生み出すものを裏付けており、非常に有害であり、対応は困難を極めています。人々はさまざまな要素に基づいて自然にまとまることがありますが、これらのメディアシステムはこうしたまとまりを強制する傾向にあります。そこで、私たちはまず、次のように問いかけます。「この問題の範囲はどうなっているのか? そして、それを解決するために何ができるだろうか?」
Harmony Labs は、データサイエンスと機械学習を使用してこれらの問いを解決します。ユーザーアンケートやメディアデータから始めて、社会問題がメディアでどのように表されているのか、これらがさまざまな視聴者によってどのように消費されているのか、こうした消費がどのような影響をもたらすのかを特定できる、高度な自然言語処理パイプラインを開発しました。
では、そもそもそのデータを入手するにはどうすればよいのでしょうか? Wanieswki 氏は次のように述べています。「私たちが必要とするすべてのメディアデータは民間企業に存在しています。データ共有が私たちのミッションの中核となることはわかっていました。だからこそ、私たちは非営利団体として組織したのです。私たちは、無党派的に公共の利益を実現すべく尽力しています。大企業との間でビッグデータの共有に関する取引を行ったこともありますし、インターネットテレビ、インターネットラジオなど、私たちが関心のあるメディアエコシステムからスクレイピングするスタートアップとも取引してきました。現在、約 10 社のデータ関連企業と提携しており、常に拡大を検討しています」
データ関連企業と提携したおかげで、Harmony Labs は、テレビ、ウェブ、モバイル、歌詞、字幕、ソーシャルメディアなど、50 テラバイトを超える多様なメディアから情報を収集することができました。これは、ビッグデータ (量、速度、および多様性) の定義に間違いなく適合しています。Golang、Python、R などの言語を扱う Harmony Labs のデータサイエンスおよびエンジニアリングチームは、データ取り込みと処理のワークフローを構築するために、Amazon Aurora、Amazon Athena、AWS Glue、Amazon Elastic Kubernetes Service (EKS) などの AWS サービスを利用しています。
データを社内で利用できるようにした後、Harmony Labs は、メディアシステムが政治、社会、および文化に与える影響を調査する学術研究者のネットワークのために、これらのデータをセキュリティ保護し、安全でアクセス可能な状態にします。Laura Edelson 氏はこれらの研究者の一人です。NYU の Tandon School of Engineering のコンピュータサイエンスの博士論文提出資格者である同氏は、オンラインでの政治的なコミュニケーションを研究し、本物ではないコンテンツや活動を特定する方法を開発しています。Harmony Labs は、Facebook における政治的な広告を調査する Ad Observatory プロジェクトで同氏を支援しました。
Harmony Labs は、Narrative Observatory などの独自のプロジェクトにも取り組んでいます。「ナラティブとは、さまざまなストーリーやメディアで繰り返されるストーリーパターンです。ナラティブは、歌詞、テレビ番組、ニュース記事などに見られます」と Wanieswki 氏は述べています。Narrative Observatory は、特定のトピックに関するナラティブを特定し、長期間にわたって、さまざまな種類のメディアでそれらを追跡するのに役立ちます。
Harmony Labs は、Bill & Melinda Gates Foundation からの最初の資金提供を受けて、米国の貧困と経済的流動性に関するトピックに関連するナラティブを研究しました。何百万もの文書 (オンラインニュース、ソーシャルメディア、音楽) を収集して、同組織はまず、メディアに存在している主要なナラティブを特定しました。その後、セグメンテーション手法、5 万人を超えるアメリカ人に関する行動データおよびアンケートを使用して、Harmony Labs は 4 層のオーディエンス、ならびにそれらのオーディエンスにとって支配的となっているナラティブ、コアバリュー、および特定の社会問題に関する見解を定義しました。最後に、Harmony Labs は、各オーディエンスがナラティブをどのように消費したかを研究しました。
資金提供者、パートナー、およびメディア企業が、自らのオーディエンスが占める文化的空間をより深く理解できるようにするために、Harmony Labs は、魅力的なウェブサイト obiaudiences.org を構築しました。このウェブサイトでは、オーディエンスを選んで関連するメディアフィードを表示することができます。つまり、文字どおり他者の目で、世界 (それらの他者が最も気にしている問題や、最も読まれているメディアなど) を見ることができるということです。これは、さまざまな人々が特定の問題について抱いている認識を理解するのに役立ちます。そして、Wanieswki 氏は次のように述べています。「人々にリーチしようとするなら、それらの人々が住んでいるメディアの世界、そして、実際にその世界と関連性があり得る事柄を理解することが重要です」
最近、Harmony Labs は、Mozilla Foundation の資金提供による人工知能 (AI) の健全なナラティブを定義するためのプロジェクトを主導しました。8 万人を超える米国の成人のテレビ消費習慣を研究し、それらを字幕付きのトランスクリプトや広告と結びつけて、同組織は AI に関する主要なメディアのナラティブを特定し、命名しました。それぞれのナラティブには、AI の定義、それが人々に植え付ける感情、そして AI が幸せと不幸せのどちらをもたらすのかについての考えが含まれます。
Harmony Labs は、AI に関する 4 つの主要なナラティブを特定しました。そのうちの 2 つは極めて否定的で恐怖を誘発するものでした。「Tool of Tyranny」(専制政治のツール) は、AI が国民を弾圧するために政府によって使用される旨を述べるものです。「Robot Overlords」(ロボットによる支配) は、AI を制御することは決してできず、私たちを支配することになるだろうと述べるものです。スペクトルの反対側では、「Wishes Granted」(願いの実現) のナラティブは非常にポジティブです。すなわち、確かに、私たちは AI を理解してはいないが、それは私たちのすべての問題を解決する魔法の杖である、と述べるものです。最後のナラティブ「Augmented Intelligence」(拡張されたインテリジェンス) はよりバランスが取れています。すなわち、確かに、 AI は私たちの日常生活を改善する素晴らしい機会ではあるが、不公平で危険なものにさえなり得るものであるため、私たちはそれを設計し、制御し、それが私たちを傷つけるのではなく、役立つものとなるように使用する責任がある、と述べるものです。
Harmony Labs では、「Wishes Granted」(願いの実現) のナラティブが最も顕著 (67%) であることがわかりました。このような結果は AI をポジティブに照らし出しますが、その純朴で楽観的に過ぎる見方は、AI に対する正当な疑問を隠し得るものでもあります。それでも、オーディエンスを巻き込み、「Augmented Intelligence」(拡張されたインテリジェンス) のナラティブでそれらのオーディエンスを教育し、機会と課題の両方に対する意識を高めることは良い出発点となります。
この投稿を終えるに際して、意図的かどうかにかかわらず、ここで私が実際に推奨したのはどの AI のナラティブであったか、ということを疑問に思っています。 皆さんはどうお考えでしょうか? 一つ確かなことがあります。それは、Harmony Labs が、日々メディアが私たちにどのような影響を与え、より民主的な社会をどう創造できるかを理解するために AI を利用しているということです。これは重要な仕事であり、同組織が目標の達成に役立てるために AWS を利用していることは当社にとって光栄なことです。
Harmony Labs の詳細については、harmonylabs.org および harmonylabs.medium.com をご覧ください。
原文はこちらです。