AWS Glue

Integrasi data yang sederhana, dapat diskalakan, dan tanpa server

AWS Glue adalah layanan integrasi data tanpa server yang memudahkan penemuan, penyiapan, dan penggabungan data untuk analitik, machine learning, dan pengembangan aplikasi. AWS Glue menyediakan semua kemampuan yang diperlukan untuk integrasi data, sehingga Anda dapat mulai menganalisis data dan menggunakannya dalam hitungan menit, bukan bulan.

Integrasi data adalah proses menyiapkan dan menggabungkan data untuk analitik, machine learning, dan pengembangan aplikasi. Proses ini melibatkan beberapa tugas, seperti menemukan dan mengekstrak data dari berbagai sumber; memperkaya, membersihkan, menormalkan, dan menggabungkan data, serta memuat dan mengatur data dalam basis data, data warehouse, dan danau data. Tugas ini biasanya ditangani oleh jenis pengguna yang berbeda yang masing-masing menggunakan produk yang berbeda.

AWS Glue memberikan antarmuka visual dan berbasis kode untuk mempermudah integrasi data. Pengguna dapat dengan mudah mencari dan mengakses data menggunakan AWS Glue Data Catalog. Teknisi data dan developer ETL (extract, transform, and load) dapat secara visual membuat, menjalankan, dan memantau alur kerja ETL dengan beberapa klik di AWS Glue Studio. Data analyst dan data scientist dapat menggunakan AWS Glue DataBrew untuk secara visual memperkaya, membersihkan, dan menormalkan data tanpa menulis kode. Dengan AWS Glue Elastic Views, developer aplikasi dapat menggunakan Structured Query Language (SQL) yang sudah dipahami untuk menggabungkan dan mereplikasi data di seluruh penyimpanan data yang berbeda.

Introducing AWS Glue (1:47)

Manfaat

Integrasi data yang lebih cepat

Berbagai grup di seluruh organisasi Anda dapat menggunakan AWS Glue untuk bekerja sama pada tugas integrasi data, termasuk ekstraksi, membersihkan, normalisasi, menggabungkan, memuat, dan menjalankan alur kerja ETL yang dapat diskalakan. Dengan cara ini, Anda dapat mengurangi waktu yang dibutuhkan untuk mulai menganalisis data Anda dari hitungan bulan ke menit.

Mengotomatiskan integrasi data Anda sesuai skala

AWS Glue mengotomatiskan sebagian besar upaya yang diperlukan untuk integrasi data. AWS Glue mengambil sumber data Anda, mengidentifikasi format data, dan menyarankan skema untuk menyimpan data Anda. AWS Glue secara otomatis menghasilkan kode untuk menjalankan transformasi data Anda dan proses pemuatan. Anda dapat menggunakan AWS Glue untuk menjalankan dan mengelola ribuan tugas ETL dengan mudah atau untuk menggabungkan dan mereplikasi data di beberapa penyimpanan data menggunakan SQL.

Tidak ada server untuk dikelola

AWS Glue berjalan di lingkungan tanpa server. Tidak ada pengelolaan infrastruktur, dan AWS Glue menyediakan, mengonfigurasi, dan menskalakan sumber daya yang diperlukan untuk menjalankan tugas integrasi data Anda. Anda hanya membayar sumber daya yang digunakan oleh tugas Anda saat bekerja.

Kasus penggunaan


Membangun pipeline ETL (extract, transform, and load) yang digerakkan kejadian

AWS Glue dapat menjalankan tugas ETL Anda saat datang data baru. Contohnya, Anda dapat menggunakan fungsi AWS Lambda untuk memicu tugas ETL Anda agar berjalan segera setelah data baru tersedia di Amazon S3. Anda juga dapat mendaftarkan dataset baru ini di Katalog Data AWS Glue sebagai bagian dari tugas ETL Anda.

Diagram pipeline ETL yang digerakkan kejadian

Membuat katalog terpadu untuk mencari data di beberapa penyimpanan data

Anda dapat menggunakan AWS Glue Data Catalog untuk dengan cepat menemukan dan mencari di berbagai set data AWS tanpa memindahkan data. Setelah data dimasukkan dalam katalog, data langsung tersedia untuk pencarian dan kueri menggunakan Amazon Athena, Amazon EMR, dan Amazon Redshift Spectrum.

Membuat dan menjalankan tugas ELT di AWS Glue

Buat, jalankan, dan pantau tugas ETL tanpa coding

AWS Glue Studio memudahkan untuk membuat, menjalankan, dan memantau tugas ETL AWS Glue secara visual. Anda dapat menyusun tugas ETL yang memindahkan dan mentransformasi data menggunakan editor tarik-dan-letakkan, dan AWS Glue secara otomatis menghasilkan kode. Anda selanjutnya dapat menggunakan dasbor eksekusi tugas AWS Glue Studio untuk memantau eksekusi ETL dan memastikan tugas Anda beroperasi seperti seharusnya. Pelajari selengkapnya tentang AWS Glue Studio di sini.

Alat ETL visual untuk developer ETL

Menjelajahi data dengan persiapan data visual layanan mandiri

AWS Glue DataBrew memungkinkan Anda menjelajahi dan bereksperimen dengan data langsung dari danau data, data warehouse, dan basis data, termasuk Amazon S3, Amazon Redshift, AWS Lake Formation, Amazon Aurora, dan Amazon RDS. Anda dapat memilih dari lebih dari 250 transformasi yang dibangun sebelumnya di AWS Glue DataBrew untuk mengotomatiskan tugas penyiapan data, seperti memfilter anomali, menstandardisasi format, dan mengoreksi nilai yang tidak valid. Setelah data disiapkan, Anda dapat segera menggunakannya untuk analitik dan pembelajaran mesin. Pelajari selengkapnya tentang AWS Glue DataBrew di sini.

Pembersihan data dan normalisasi data visual

Membangun tampilan termaterialisasi untuk menggabungkan dan mereplikasi data (dalam pratinjau)

AWS Glue Elastic Views memungkinkan Anda menggunakan SQL yang sudah dipahami untuk membuat tampilan termaterialisasi. Gunakan tampilan ini untuk mengakses dan menggabungkan data dari beberapa penyimpanan data sumber, dan jaga agar data gabungan tersebut selalu diperbarui dan dapat diakses dari penyimpanan data target. Pratinjau AWS Glue Elastic Views saat ini mendukung Amazon DynamoDB sebagai sumber, diikuti dengan dukungan untuk Amazon Aurora dan Amazon RDS. Target yang saat ini didukung adalah Amazon Redshift, Amazon S3, dan Amazon Elasticsearch Service, diikuti dengan dukungan untuk Amazon Aurora, Amazon RDS, dan Amazon DynamoDB. Pelajari selengkapnya tentang AWS Glue Elastic Views di sini.

Pembersihan data dan normalisasi data visual

Apa yang Baru

tanggal
  • tanggal
1
Fitur AWS Glue
Periksa fitur AWS Glue

Pelajari selengkapnya tentang fitur utama AWS Glue.

Pelajari selengkapnya 
Daftar akun AWS
Daftar untuk akun gratis

Dapatkan akses secara instan ke AWS Tingkat Gratis. 

Daftar 
Mulai membangun di konsol
Mulai membangun di AWS Glue

Mulai membangun dengan AWS Glue di antarmuka ETL visual.

Masuk