Logo Dow Jones - Huruf D besar berwarna biru dengan huruf J terlihat di bagian yang melengkung, serta tulisan Dow Jones berwarna hitam di bawahnya

The Wall Street Journal Memberdayakan Pembaca dengan Alat Pencarian Menggunakan Amazon Kendra

2021

Menjelang pemilihan presiden AS 2020, The Wall Street Journal (WSJ) ingin memberdayakan pembaca agar lebih mudah mengakses dan memahami hal-hal yang dikatakan oleh para kandidat, serta pendapat kandidat mengenai topik yang penting bagi pembaca. Pada tanggal 5 Juni 2019, melalui studi yang dilakukan oleh Pew Research Center, ditemukan bahwa hampir 80 persen orang Amerika mengatakan bahwa mereka telah memeriksa sendiri fakta dalam berita untuk menemukan sumber informasi yang asli. 

Tim Produk dan Teknologi WSJ beralih ke Amazon Web Services (AWS) untuk membangun pengalaman pelanggan yang baru. Melalui kolaborasi dengan tim ahli global dari program AWS Digital Innovation dan AWS Professional Services, yaitu tim ahli global yang dapat membantu bisnis mewujudkan hasil yang diinginkan di AWS, tim WSJ mampu mempercepat pengembangan Talk2020. Talk2020 adalah alat pencarian cerdas yang membantu pembaca untuk mencari dan menganalisis dengan cepat pernyataan publik dalam 30 tahun yang dibuat oleh calon presiden. Talk2020 memungkinkan penyelidikan yang lebih dalam terhadap masalah dari waktu ke waktu dengan menjelajahi pola bicara dan melakukan analisis tulisan. Kunci keberhasilan WSJadalah penggunaan Amazon Kendra, yaitu layanan pencarian cerdas yang sangat akurat dan didukung oleh machine learning.

Bar kopi dengan logo Dow Jones di kantornya
kr_quotemark

AWS membantu kami membangun solusi yang sesuai dengan jadwal kami. Dengan memiliki akses langsung ke para ahli, memungkinkan kami untuk menempatkan layanan yang tepat di sekitar Amazon Kendra dan memberikan tingkat kualitas yang kami inginkan.”

Dion Bailey 
Kepala Teknologi dan Arsitektur WSJ

Memberdayakan Pembaca dengan Informasi yang Akurat

The Wall Street Journal adalah organisasi berita global yang menyediakan berita, informasi, komentar, dan analisis, serta melibatkan pembaca di seluruh platform cetak, digital, seluler, sosial, audio, dan video. Selain membangun warisannya sebagai sumber berita bisnis dan keuangan global, WSJ mencakup liputan berita, politik, seni, budaya, gaya hidup, olahraga, dan kesehatan di AS dan seluruh dunia, serta memegang 38 Penghargaan Pulitzer untuk jurnalisme yang luar biasa. Untuk itu, ia melihat peluang untuk memberikan fungsionalitas dan menjangkau anggota audiens baru dengan memungkinkan pembaca menjelajahi basis data transkrip. “Kami ingin membangun sesuatu yang dapat digunakan pembaca untuk mencari tahu kata per kata yang diucapkan oleh Joe Biden, Donald Trump, dan pasangan mereka, serta menarik kesimpulan mereka sendiri,” kata Dion Bailey, Wakil Direktur, Kepala Teknologi dan Arsitektur WSJ

Wartawan WSJ yang menulis berita investigasi sudah menggunakan Factiva, yaitu basis data berita global milik Dow Jones, untuk penelitian dan pengecekan fakta. Factiva mengumpulkan konten dari 32.000 sumber lebih dan memungkinkan pengguna untuk mencari berdasarkan teks bebas, wilayah, subjek, penulis, dan metadata. Tim R&D WSJtelah bekerja dengan wartawan di Washington, DC, guna membangun alat pencarian yang efektif untuk transkrip ini. Dengan Talk2020, WSJingin menjadikan alat ini agar lebih mudah digunakan dan tersedia bagi khalayak yang lebih luas guna membantu menginformasikan pengambilan keputusan mereka selama pemilihan presiden 2020. Publikasi tersebut ingin agar pembaca dapat mengajukan pertanyaan dalam bahasa alami—seperti “Apa pendapat Trump mengenai perawatan kesehatan?”—dan menerima hasil yang langsung menjawabnya. Solusi yang terstruktur dengan baik juga berpotensi meningkatkan lalu lintas situs dan menarik pelanggan baru. 

Tim WSJ, yang sudah menggunakan AWS, secara teratur menggunakan AWS Professional Services selama pembuatan melalui stand-up harian, rapat mingguan, dan pendalaman arsitektur. “AWS membantu kami membangun solusi yang sesuai dengan jadwal kami,“ kata Bailey. “Dengan memiliki akses langsung ke para ahli, memungkinkan kami untuk menempatkan layanan yang tepat di sekitar Amazon Kendra dan memberikan tingkat kualitas yang kami inginkan.”

Menyatukan Strategi Konten dan Strategi Produk

Tim WSJ dengan cepat membangun Talk2020 menggunakan AWS dan memenuhi tujuannya untuk diluncurkan pada bulan September 2020, sebelum debat presiden pertama. Solusi tersebut menggunakan Amazon Kendra untuk menyediakan kemampuan pencarian korporasi yang andal. “Fakta bahwa Amazon Kendra dapat melakukan pemrosesan bahasa alami secara langsung merupakan daya tarik besar bagi kami,” kata Bailey. Tampak depan dari solusi pencarian terdiri dari gateway API dan Amazon CloudFront, yaitu jaringan pengiriman konten yang cepat, sangat aman, dan dapat diprogram. Saat pengguna melakukan pencarian, Amazon Kendra kembali dengan topik yang diidentifikasi dan kutipan terkait, yang selanjutnya ditambah dengan mereferensi silang identifikasi dengan transkrip Factiva yang telah dibersihkan dan disimpan di Amazon DynamoDB—layanan basis data NoSQL yang mendukung nilai kunci dan struktur data dokumen . 

Yang mengelola aliran data di antara layanan AWS adalah AWS Lambda, yaitu layanan komputasi nirserver yang memungkinkan pengguna menjalankan kode tanpa menyediakan atau mengelola server. “Kami harus membuat lapisan penyerapan antara Factiva dan lapisan data,” kata Bailey. Fungsi AWS Lambda memicu permintaan untuk membersihkan dan memformat transkrip—mengidentifikasi kutipan, pembicara, dan topik—sebelum mengirimkannya ke Amazon Kendra dan Amazon DynamoDB. “Dengan mengandalkan fungsi Lambda untuk tugas-tugas tersebut menandakan bahwa kami dapat menghentikan proses saat tidak menggunakannya, sehingga hemat biaya,” tambah Bailey. 

Data dari alat Talk2020 menunjukkan lonjakan penggunaan selama dan setelah debat presiden, debat wakil presiden, dan acara di balai kota. Banyak orang bahkan menggunakan alat pencarian sebagai layar kedua selama debat untuk meneliti pernyataan yang dibuat kandidat di masa lalu. Keterlibatan dengan Talk2020 sangatlah kuat, ditandai dengan pengguna individu yang seringkali mengajukan banyak pertanyaan dan menjelajahi beberapa topik selama kunjungan yang sama. “Kuatnya keterlibatan tersebut menunjukkan kepada kami bahwa kami telah menciptakan alat yang memenuhi kebutuhan para pembaca, dan memiliki kesempatan untuk terus bereksperimen dengan cara-cara baru untuk melibatkan pengguna kami,” kata Bailey.

Kasus Penggunaan dari Pencarian Cerdas Masa Depan yang Menginspirasi

Keterlibatan tim AWS dan penggunaan layanan inovatif seperti Amazon Kendra membantu WSJ meluncurkan Talk2020 hanya dalam 5 bulan, mendorong lalu lintas situs, mendorong keterlibatan, dan menarik pelanggan baru. “Tim AWS tersedia kapan pun kami membutuhkan,” kata Bailey, “dan itu membantu kami menyelesaikan setiap masalah yang muncul.”


Mengenai The Wall Street Journal

Didirikan pada tahun 1889 dan merupakan milik Dow Jones & Company, The Wall Street Journal adalah organisasi berita global yang berbasis di New York yang berfokus pada bisnis, keuangan, ekonomi, dan kekuatan global. The Wall Street Journal melibatkan pembaca di seluruh platform cetak, digital, seluler, sosial, audio, dan video. Pemenang lebih dari tiga lusin Pulitzer Prizes, sirkulasi The Wall Street Journalmencapai jutaan.

Manfaat AWS

  • Meluncurkan alat pencarian Talk2020 dalam waktu 5 bulan
  • Membuat alat pencarian dengan pemrosesan bahasa alami
  • Meningkatkan keterlibatan

Layanan AWS yang Digunakan

Amazon Kendra

Amazon Kendra adalah layanan pencarian cerdas yang didukung oleh machine learning. Kendra menata ulang pencarian korporasi untuk situs web dan aplikasi Anda sehingga karyawan dan pelanggan Anda dapat menemukan konten yang mereka cari dengan mudah, bahkan jika tersebar di beberapa lokasi dan repositori konten dalam organisasi Anda.

Pelajari selengkapnya »

Amazon CloudFront

Amazon CloudFront adalah layanan jaringan pengantaran konten (CDN) cepat yang mengantarkan data, video, aplikasi, dan API kepada pelanggan secara global dengan aman dan dengan tingkat latensi rendah, kecepatan transfer tinggi, semua dalam lingkungan yang ramah pengembang.

Pelajari selengkapnya »

Amazon DynamoDB

Amazon DynamoDB adalah basis data nilai-kunci dan dokumen yang menghadirkan performa satu digit milidetik dalam skala apa pun. Basis data ini terkelola penuh, multiaktif, multiwilayah dan tahan lama dengan keamanan, cadangan dan pemulihan bawaan, serta caching dalam memori untuk aplikasi skala internet.

Pelajari selengkapnya »

AWS Lambda

AWS Lambda adalah layanan komputasi nirserver yang memungkinkan Anda menjalankan kode tanpa menyediakan atau mengelola server, membuat logika penskalaan klaster yang sadar beban kerja, mempertahankan integrasi peristiwa, atau mengelola waktu aktif. Dengan Lambda, Anda dapat menjalankan kode untuk hampir semua jenis aplikasi atau layanan backend - semuanya tanpa administrasi.

Pelajari selengkapnya »


Mulai

Perusahaan segala ukuran dan lintas industri mentransformasikan bisnisnya setiap hari menggunakan AWS. Hubungi ahli kami dan mulai perjalanan AWS Cloud Anda sendiri sekarang juga.