Amazon Redshift

Gambaran Umum
Fitur
Harga
Solusi
Sumber Daya

Integrasi Amazon Redshift untuk Apache Spark

Buat aplikasi Apache Spark yang akan membaca dan menulis data dari Amazon Redshift

Mengapa Integrasi Amazon Redshift untuk Apache Spark?

Integrasi Amazon Redshift untuk Apache Spark menyederhanakan dan mempercepat aplikasi Apache Spark yang mengakses data Amazon Redshift dari layanan analitik AWS, seperti Amazon EMR, AWS Glue, dan Amazon SageMaker. Dengan Amazon EMR, AWS Glue, dan SageMaker, Anda dapat dengan cepat membangun aplikasi Apache Spark yang akan membaca dan menulis ke gudang data Amazon Redshift, tanpa mengorbankan konsistensi performa atau transaksional. Integrasi Amazon Redshift untuk Apache Spark juga menggunakan kredensial berbasis AWS Identity and Access Management (IAM) untuk meningkatkan keamanan. Dengan Integrasi Amazon Redshift untuk Apache Spark, tidak akan ada penyiapan dan pemeliharaan manual dari versi konektor pihak ketiga yang tidak bersertifikasi. Anda dapat memulai tugas Apache Spark menggunakan data di Amazon Redshift dalam hitungan detik. Integrasi baru ini meningkatkan performa aplikasi Apache Spark menggunakan data Amazon Redshift.

Manfaat Amazon Redshift

Memperluas cakupan sumber data yang Anda gunakan di analitik yang kaya dan aplikasi machine learning (ML) yang berjalan di Amazon EMR, AWS Glue, atau SageMaker dengan membaca dari dan menulis data ke gudang data Anda.

Menyederhanakan proses yang rumit dan seringkali manual dalam menyiapkan konektor dan driver JDBC yang tidak bersertifikat sehingga mengurangi waktu persiapan tugas analitik dan ML.

Menggunakan kemampuan pushdown, seperti fungsi urutkan, agregasi, batasi, gabungkan, dan skalar sehingga hanya data yang relevan yang dipindahkan dari gudang data Amazon Redshift.

Cara kerjanya

Gunakan layanan AWS untuk membuat aplikasi Apache Spark yang akan membaca dan menulis ke gudang data Amazon Redshift Anda.

Perbesar dan baca deskripsi gambar

A diagram illustrating integration between AWS Glue, Amazon EMR, Amazon SageMaker, and Amazon Redshift using Amazon Redshift Integration for Apache Spark, enabling access to Redshift data through Apache Spark applications.

Kasus penggunaan

Buat aplikasi Apache Spark di Java, Scala, dan Python menggunakan layanan analitik AWS berbasis Apache Spark.

Baca dan tulis data ke dan dari Amazon Redshift menggunakan Amazon EMR, AWS Glue, SageMaker, serta layanan analitik AWS dan ML.

Gunakan Amazon EMR atau AWS Glue untuk mengambil kode kerangka data dari tugas Apache Spark atau notebook Anda dan hubungkan ke Amazon Redshift.

Sederhanakan proses Anda tanpa instalasi atau pengujian, keamanan yang ditingkatkan (kredensial berbasis IAM) dan pushdown operasional, serta format file Parquet untuk performa.

Pelanggan

Corey Johnson, Data Architect Manager - Huron Consulting

Huron adalah sebuah perusahaan layanan profesional global yang berkolaborasi dengan klien untuk mewujudkan berbagai kemungkinan dengan menciptakan strategi yang tepat, mengoptimalkan operasi, mempercepat transformasi digital, dan memberdayakan bisnis serta karyawan agar dapat menentukan masa depan mereka sendiri.

"Kami memberdayakan teknisi kami untuk membangun pipeline data dan aplikasi mereka dengan Apache Spark menggunakan Python dan Scala. Kami menginginkan solusi khusus yang menyederhanakan operasi serta mengirimkan dengan lebih cepat dan lebih efisien untuk klien. Hal itu kami dapatkan saat menggunakan Integrasi Amazon Redshift untuk Apache Spark."

Alcuin Weidus, Sr Principal Data Architect - GE Aerospace

GE Aerospace adalah penyedia global mesin jet, komponen, dan sistem untuk pesawat terbang komersial dan militer. Perusahaan ini telah merancang, mengembangkan, dan memproduksi mesin jet sejak Perang Dunia I.

“GE Aerospace menggunakan analitik AWS dan Amazon Redshift untuk memungkinkan wawasan bisnis utama yang mendukung keputusan bisnis penting. Dengan dukungan salin otomatis dari Amazon S3, kami dapat membangun pipeline data yang lebih sederhana untuk memindahkan data dari Amazon S3 ke Amazon Redshift. Hal ini mempercepat kemampuan tim produk data untuk mengakses data dan memberikan wawasan ke pengguna akhir. Kami menghabiskan lebih banyak waktu untuk menambahkan nilai melalui data dan lebih sedikit waktu untuk integrasi.”

Neema Raphael, Chief Data Officer - Goldman Sachs

Goldman Sachs Group, Inc.adalah institusi keuangan global terkemuka yang menghadirkan berbagai layanan keuangan di bidang perbankan investasi, sekuritas, manajemen investasi, dan perbankan konsumen untuk basis klien yang besar dan beragam, termasuk perusahaan, institusi keuangan, pemerintah, dan individu.

"Fokus kami adalah memberikan akses layanan mandiri ke data untuk semua pengguna di Goldman Sachs. Melalui Legend, platform manajemen dan tata kelola data sumber terbuka, kami memungkinkan pengguna untuk mengembangkan aplikasi pusat data dan memperoleh wawasan yang didukung data saat kami berkolaborasi di seluruh industri layanan keuangan. Dengan integrasi Amazon Redshift untuk Apache Spark, tim platform data kami dapat mengakses data dengan langkah manual minimum—memungkinkan ETL kode nol yang akan meningkatkan kemampuan kami untuk memudahkan teknisi fokus menyempurnakan alur kerja mereka saat mengumpulkan informasi yang lengkap dan tepat waktu. Kami berharap dapat menyaksikan peningkatan performa aplikasi dan keamanan karena pengguna kami kini dapat mengakses data terbaru di Amazon Redshift dengan mudah.”

Sumber Daya

Video

Tonton video teknis mengenai Integrasi Amazon Redshift untuk Apache Spark.

Tonton sekarang

Blog

Baca posting blog mengenai Integrasi Amazon Redshift untuk Apache Spark.

Pelajari selengkapnya

Dokumentasi

Baca panduan manajemen teknis mengenai Integrasi Amazon Redshift untuk Apache Spark.

Jelajahi di sini

Mulai Amazon Redshift

Apa itu Amazon Redshift?

Pelajari selengkapnya

Konektor Amazon Redshift Spark di AWS Glue

Pelajari selengkapnya

Versi driver JDBC dengan dukungan AWS Glue

Pelajari selengkapnya

Apakah Anda sudah menemukan yang Anda cari?

Beri tahu kami agar kami dapat meningkatkan kualitas konten di halaman kami

Integrasi Amazon Redshift untuk Apache Spark

Mengapa Integrasi Amazon Redshift untuk Apache Spark?

Manfaat Amazon Redshift

Cara kerjanya

Kasus penggunaan

Pelanggan

Corey Johnson, Data Architect Manager - Huron Consulting

Alcuin Weidus, Sr Principal Data Architect - GE Aerospace

Neema Raphael, Chief Data Officer - Goldman Sachs

Sumber Daya

Tonton video teknis mengenai Integrasi Amazon Redshift untuk Apache Spark.

Baca posting blog mengenai Integrasi Amazon Redshift untuk Apache Spark.

Baca panduan manajemen teknis mengenai Integrasi Amazon Redshift untuk Apache Spark.

Mulai Amazon Redshift

Apa itu Amazon Redshift?

Konektor Amazon Redshift Spark di AWS Glue

Versi driver JDBC dengan dukungan AWS Glue

Apakah Anda sudah menemukan yang Anda cari?

Pelajari

Sumber Daya

Developer

Bantuan

Integrasi Amazon Redshift untuk Apache Spark

Mengapa Integrasi Amazon Redshift untuk Apache Spark?

Manfaat Amazon Redshift

Meningkatkan analitik Apache Spark menggunakan data Amazon Redshift

Mengakses data Amazon Redshift dengan penyiapan minimal

Meningkatkan performa dan keamanan dengan konektor bersertifikasi Amazon

Cara kerjanya

Kasus penggunaan

Buat aplikasi ETL, ML, dan interaktif

Hubungkan ke gudang data Amazon Redshift Anda

Jalankan kueri dalam hitungan detik

Konektor bersertifikat AWS yang dapat langsung digunakan

Pelanggan

Corey Johnson, Data Architect Manager - Huron Consulting

Alcuin Weidus, Sr Principal Data Architect - GE Aerospace

Neema Raphael, Chief Data Officer - Goldman Sachs

Sumber Daya

Tonton video teknis mengenai Integrasi Amazon Redshift untuk Apache Spark.

Baca posting blog mengenai Integrasi Amazon Redshift untuk Apache Spark.

Baca panduan manajemen teknis mengenai Integrasi Amazon Redshift untuk Apache Spark.

Mulai Amazon Redshift

Apa itu Amazon Redshift?

Konektor Amazon Redshift Spark di AWS Glue

Versi driver JDBC dengan dukungan AWS Glue

Apakah Anda sudah menemukan yang Anda cari?

Pelajari

Sumber Daya

Developer

Bantuan