用机器学习解码媒体的社交影响

如果媒体经过优化以造福人们将会怎样？这个发人深省的问题是 Harmony Labs 使命的核心所在。Harmony Labs 是一家总部位于纽约市的非营利组织，致力于更好地了解媒体对社会的影响，并建立社区和工具来对媒体系统进行改革和转型。

正如 Harmony Labs 执行董事 Brian Wanieswki 所言：“无论好坏，我们现在拥有的媒体系统已经成为愤怒机器和分拣机器，将人们置于类似的群体中。鉴于这些系统的商业激励结构，人们的愤怒越大，系统产生的利润也就越大。近年来，世界各地的政治事件证实了这些媒体系所产生的结果，这些内容真的很有大的毒性，而且很难在其内部完成任何事情。人与人之间存在各种自然分歧，但这些媒体系统往往会强化这些分歧。所以，我们要问的第一个问题是，这个问题的范围是什么？然后，我们能做些什么来解决这个问题？”

Harmony Labs 使用数据科学和机器学习来回答这些问题。从用户调查和媒体数据开始，他们开发了先进的自然语言处理管道，用以确定社会问题在媒体中的表现方式、不同受众如何消费内容以及消费产生了什么样的影响。

那么要如何首先获得这些数据呢？ Brain 指出：“我们需要的所有媒体数据都存在于私营公司内部。我们知道，数据共享将是我们使命的核心，这就是为什么我们会成为非营利组织的原因。我们以无党派的方式为了公众的利益而努力。我们已经与大型公司以及初创公司完成了大数据共享协议，涉及我们感兴趣的媒体生态系统的各个角落，包括互联网电视、互联网广播等。目前我们有大约 10 个数据合作伙伴，而我们仍一直在寻求扩展规模。”

借助他们的数据合作伙伴，Harmony Labs 得以收集超过 50 TB 的多种媒体数据：电视、网络、手机、歌词、隐藏式字幕、社交媒体等。这绝对符合大数据的定义（无论是从数量、速度还是品种上而言）。Harmony Labs 的数据科学和工程团队使用 Golang、Python 和 R 等语言，依靠 AWS 服务（如 Amazon Aurora、Amazon Athena、 AWS Glue 和 Amazon Elastic Kubernetes Service (EKS)）来构建他们的数据摄入和处理工作流。

获得数据之后，Harmony Labs 便可以将这些数据以安全、可靠且可访问的形式提供给学术研究人员组成的网络，他们将使用这些数据来调查媒体系统对政治、社会和文化的影响。Laura Edelson 是这些研究人员中的一员。一个博士作为纽约大学 Tandon 工程学院的计算机科学专业的在读学生，她致力于研究线上政治沟通，并开发识别不真实内容和活动的方法。Harmony Labs 通过广告观察站项目为她提供了支持，该项目专注于探索 Facebook 上的政治广告。

Harmony Labs 还开展了自己的项目，例如叙事天文台。“叙事是一种在不同类型的故事和媒体中重复出现的故事模式。你会在歌词、电视节目、新闻文章等媒介中发现它们的身影。”Brain 说道。叙事观察站有助于识别有关特定主题的叙述，并在长期在不同媒体类型中对其进行跟踪。

在比尔及梅琳达·盖茨基金会的初步资助下，Harmony Labs 研究了与美国贫困和经济流动性相关的叙事。他们收集了数百万份文档（在线新闻、社交媒体、音乐），首先确定了媒体中存在的主要叙事。然后，借助细分技术以及关于 50,000 多名美国人的行为的数据和调查，Harmony Labs 定义了四个受众，以及他们的主导叙事、核心价值观及其对具体社会问题的看法。最后，Harmony Labs 研究了每个观众是如何消费这些叙事的。

为了使资助者、合作伙伴和媒体公司能够更深入地了解他们的受众所占据的文化空间，他们建立了一个强大的网站 obiaudiences.org，您可以在其中挑选受众并查看相关的媒体源。换言之，您可以从别人的眼中观察世界：他们最关心什么问题，他们最关注的是什么媒体，等等。这有助于理解不同人对某些问题的看法，正如 Brain 所说的那样：“如果你想接触到人们，那就必须了解他们所居住的媒体世界，以及与那个世界实际相关的内容。”

最近，Harmony Labs 领导了一个由 Mozilla Foundation 资助的项目，该项目旨在为人工智能（AI）定义健康的叙述。他们研究了 80,000 多名美国成年人的电视消费习惯，并将他们与封闭式字幕记录和广告联系起来，确定并命名了关于 AI 的主要媒体叙事。每个叙事都包括 AI 的定义、它在人类中创造的情感，以及他们是否认为 AI 会导致幸福还是不幸的结局。

Harmony Labs 确定了关于 AI 的四个主要叙述。其中两个极为负面且令人恐惧。“暴政的工具”说，政府将利用 AI 来压迫人们。“机器人霸主”说，我们永远无法控制 AI，而 AI 最终将统治我们。另一方面，“授予愿望”的叙述非常积极：当然，我们不了解 AI，但它是一个能解决我们所有问题的魔杖。最后一个叙述“增强智能”则更加平衡：是的，AI 是改善我们日常生活的绝佳机会，但它也能够招致不公甚至危险。我们有责任设计、控制它，并确保它被用来帮助我们，而不是伤害我们。

Harmony Labs 发现，“授予愿望”的叙述是最突出的 (67％)。它给 AI 带来了积极的影响，但其天真和过于乐观的愿景会掩盖 AI 提出的合理问题。尽管如此，能够吸引受众、通过“增强智能”叙事对他们进行教育，同时提高他们对机遇和挑战的认识，这算是一个很好的起点。

关闭这篇文章，我想知道我在这里真正推广了哪种 AI 叙事，不管是否出于自愿！您觉得怎么样？有一点是肯定的：Harmony Labs 正在使用 AI 来帮助我们了解媒体每天对我们产生的影响，以及我们该如何创造一个更民主的社会。这是一项重要的工作，而我们很荣幸他们选择了 AWS 来帮助他们实现自己的目标。

有关 Harmony Labs 的更多信息，请访问 harmonylabs.org 和 harmonylabs.medium.com。

– Julien

亚马逊AWS官方博客

用机器学习解码媒体的社交影响

了解

资源

开发人员

帮助