AWS Glue

Penyiapan data sederhana, dapat diskalakan, dan tanpa server

AWS Glue adalah layanan penyiapan data tanpa server yang memudahkan para teknisi data mengekstrak, mentransformasi, dan memuat (ETL), pengembang, analis data, dan ilmuwan data mengekstrak, membersihkan, memperkaya, menormalkan, dan memuat data. AWS Glue mengurangi waktu yang dibutuhkan untuk mulai menganalisis data Anda dari hitungan bulan ke menit.

Penyiapan data adalah proses yang penting tetapi menantang. Untuk menyiapkan data Anda untuk dianalisis, Anda terlebih dulu mengekstrak data dari berbagai sumber. Selanjutnya Anda membersihkannya, mentransformasinya ke dalam format yang dibutuhkan, dan memuatnya ke database, gudang data, dan data lake untuk analisis lebih lanjut. Tugas ini sering kali dilakukan oleh berbagai grup dengan berbagai alat.

AWS Glue memberi Anda antarmuka visual dan berbasis kode untuk memudahkan penyiapan data. Teknisi data dan pengembang ETL dapat menggunakan AWS Glue Studio untuk membuat, menjalankan, dan memantau alur kerja ETL dengan beberapa klik. Analis data dan ilmuwan data dapat menggunakan AWS Glue DataBrew untuk membersihkan dan menormalkan data secara visual tanpa menulis kode.

Memperkenalkan AWS Glue (1:47)

Keuntungan

Menyiapkan data lebih cepat

AWS Glue menyediakan berbagai alat terintegrasi bagi semua pengguna Anda untuk menyederhanakan penyiapan data untuk analitik dan pembelajaran mesin. Berbagai grup di seluruh organisasi Anda dapat bekerja sama untuk menyiapkan data, termasuk ekstraksi, membersihkan, normalisasi, memuat, dan menjalankan alur kerja ETL yang dapat diskalakan. Dengan cara ini, Anda dapat mengurangi waktu yang dibutuhkan untuk mulai menganalisis data Anda dari hitungan bulan ke menit.

Mengotomatiskan sesuai skala

AWS Glue akan mengotomatiskan sebagian besar upaya yang dibutuhkan untuk penyiapan. AWS Glue mengambil sumber data Anda, mengidentifikasi format data, dan menyarankan skema untuk menyimpan data Anda. AWS Glue secara otomatis menghasilkan kode untuk menjalankan transformasi data Anda dan proses pemuatan. Anda dapat menggunakan AWS Glue untuk menjalankan dan mengelola ribuan tugas ETL dengan mudah guna menyiapkan petabita data secara efisien untuk analitik dan pembelajaran mesin.

Tidak ada server untuk dikelola

AWS Glue menjalankan Apache Spark dan Python di lingkungan tanpa server. Tidak ada infrastruktur yang perlu dikelola, dan AWS Glue akan menyediakan, mengonfigurasi, dan menskalakan sumber daya yang dibutuhkan untuk menjalankan tugas penyiapan data Anda. Anda hanya membayar sumber daya yang digunakan oleh tugas Anda saat bekerja.

Kasus penggunaan


Tampilan yang seragam untuk data Anda di beberapa penyimpanan data

Anda dapat menggunakan AWS Glue Data Catalog untuk dengan cepat menemukan dan mencari antar berbagai set data AWS tanpa memindahkan data. Setelah data dimasukkan dalam katalog, data langsung tersedia untuk pencarian dan kueri menggunakan Amazon Athena, Amazon EMR, dan Amazon Redshift Spectrum.

Membuat dan menjalankan tugas ELT di AWS Glue

Pipeline ETL yang digerakkan kejadian

AWS Glue dapat menjalankan tugas ETL Anda saat datang data baru. Contohnya, Anda dapat menggunakan fungsi AWS Lambda untuk memicu tugas ETL Anda agar berjalan segera setelah data baru tersedia di Amazon S3. Anda juga dapat mendaftarkan dataset baru ini di Katalog Data AWS Glue sebagai bagian dari tugas ETL Anda.

Diagram pipeline ETL yang digerakkan kejadian

ETL big data tanpa coding

AWS Glue Studio memudahkan untuk membuat, menjalankan, dan memantau tugas ETL AWS Glue secara visual. Anda dapat menyusun tugas ETL yang menggerakkan dan mentransformasi data, lalu menjalankannya di AWS Glue. Anda lalu dapat menggunakan dasbor eksekusi tugas AWS Glue Studio untuk memantau eksekusi ETL dan memastikan tugas Anda beroperasi seperti seharusnya. Pelajari selengkapnya tentang AWS Glue Studio di sini.

Alat ETL visual untuk pengembang ETL

Penyiapan data visual layanan mandiri

AWS Glue DataBrew memungkinkan Anda menjelajahi dan bereksperimen dengan data langsung dari data lake, gudang data, dan database, termasuk Amazon S3, Amazon Redshift, AWS Lake Formation, Amazon Aurora, dan Amazon RDS. Anda dapat memilih dari lebih dari 250 transformasi yang dibangun sebelumnya di AWS Glue DataBrew untuk mengotomatiskan tugas penyiapan data, seperti memfilter anomali, menstandardisasi format, dan mengoreksi nilai yang tidak valid. Setelah data disiapkan, Anda dapat segera menggunakannya untuk analitik dan pembelajaran mesin. Pelajari selengkapnya tentang AWS Glue DataBrew di sini.

Pembersihan data dan normalisasi data visual

Apa yang Baru

tanggal
  • tanggal
1
Fitur AWS Glue
Periksa fitur AWS Glue

Pelajari selengkapnya tentang fitur utama AWS Glue.

Pelajari selengkapnya 
Daftar akun AWS
Daftar untuk akun gratis

Dapatkan akses secara instan ke AWS Tingkat Gratis. 

Daftar 
Mulai membangun di konsol
Mulai membangun di AWS Glue

Mulai membangun dengan AWS Glue di antarmuka ETL visual.

Masuk