AWS Glue Data Integration Engines

Pilih mesin integrasi data yang tepat untuk keahlian pengguna dan beban kerja analitik Anda

AWS Glue adalah layanan integrasi data nirserver yang menawarkan banyak mesin integrasi data untuk mendukung pengguna dan beban kerja Anda. Dengan AWS Glue, Anda dapat menggunakan mesin yang sesuai untuk beban kerja apa pun, berdasarkan karakteristik beban kerja dan preferensi developer serta analis Anda.

Memperkenalkan AWS Glue for Ray

Fitur utama

AWS Glue for Apache Spark

AWS Glue menyediakan infrastruktur nirserver dengan performa dioptimalkan guna menjalankan Apache Spark untuk integrasi data dan tugas extract, transform, and load (ETL). AWS Glue for Apache Spark mendukung pemrosesan batch dan aliran serta mempercepat penyerapan, pemrosesan, dan integrasi data. Anda kemudian dapat membuat dan memperbarui danau data serta gudang data, dan mengekstrak wawasan dari data dengan lebih cepat.

AWS Glue for Ray

Dengan AWS Glue for Ray, rekayasawan dan developer data Anda dapat memproses set data besar menggunakan Python dan pustaka Python yang populer. AWS Glue menggunakan Ray (Ray.io), sebuah kerangka kerja komputasi terpadu sumber terbuka yang digunakan untuk menskalakan beban kerja Python. AWS Glue for Ray menyertakan pustaka pemrosesan data Python yang populer, agar Anda dapat membawa pustaka Anda sendiri untuk menyesuaikan tugas integrasi data.

AWS Glue for Python Shell

Dengan AWS Glue for Python Shell, Anda dapat menggunakan Tugas Python Shell untuk menjalankan skrip Python di AWS Glue. Melalui tugas ini, Anda dapat menulis tugas integrasi dan analitik data yang kompleks dengan Python. Tugas AWS Glue for Python Shell menawarkan pustaka analitik umum yang luar biasa, termasuk Pandas, NumPy, dan Amazon SageMaker Data Wrangler. Anda dapat menggunakan fungsionalitas yang dipaket untuk terhubung ke berbagai basis data, gudang data, dan layanan AWS.