Mengapa harus AWS Glue?

Menyiapkan data Anda untuk memperoleh hasil yang berkualitas merupakan langkah pertama dalam proyek analitik atau AI. AWS Glue adalah layanan nirserver yang menjadikan integrasi data lebih sederhana, lebih cepat, dan lebih hemat biaya. Anda dapat menemukan dan terhubung ke lebih dari 100 sumber data yang beragam, mengelola data Anda dalam katalog data terpusat, serta secara visual membuat, menjalankan, dan memantau pipeline data untuk memuat data ke dalam danau data, gudang data, dan lakehouse Anda. Dengan kemampuan AI generatif bawaan, Anda dapat memodernisasi tugas Apache Spark dan berkembang lebih cepat dengan dengan bantuan cerdas untuk penulisan ETL dan pemecahan masalah Spark.

Integrasikan data Anda dengan AWS Glue di Amazon SageMaker generasi berikutnya

Dengan AWS Glue di Amazon SageMaker generasi berikutnya, Anda dapat mengelola dan membangun beban kerja Anda di satu tempat dengan integrasi data yang hemat biaya, nirserver, dan dapat diskalakan.

Pelajari selengkapnya

Keuntungan

AWS Glue menyediakan semua kemampuan yang diperlukan untuk integrasi data, sehingga Anda dapat memperoleh wawasan dan memanfaatkan data Anda dengan cepat. AWS Glue menyediakan toolkit nirserver yang dikelola sepenuhnya untuk merancang dan mengotomatiskan pipeline data modern—dengan fitur ETL bawaan, penemuan skema, dan integrasi lintas layanan.

AWS Glue secara otomatis menskalakan bahkan pekerjaan pemrosesan data intensif sumber daya yang paling menuntut dari gigabyte hingga petabyte tanpa infrastruktur untuk dikelola, dan Anda hanya membayar untuk sumber daya yang digunakan.

AWS Glue menghilangkan kebutuhan untuk mengelola infrastruktur dengan menyediakan pipeline data nirserver yang dilengkapi dengan kemampuan penjadwalan dan pemantauan bawaan, sehingga tim dapat fokus membangun alur kerja data tanpa harus memelihara server.

Dapatkan bantuan yang ditenagai AI sepanjang perjalanan integrasi data Anda—mulai dari membuat kode ETL secara otomatis hingga memodernisasi tugas Spark Anda. AWS Glue menyediakan pembuatan kode cerdas, peningkatan Spark dengan bantuan AI, dan pemecahan masalah Spark bawaan.

Integrasikan data Anda, di mana pun data tersebut berada, dengan konektivitas cepat dan mudah ke berbagai sumber data di generasi terbaru Amazon SageMaker. Buat proyek pemrosesan data dengan menggabungkan AWS Glue, Amazon Athena, Amazon EMR, dan MWAA - semuanya dalam Amazon SageMaker - dan nikmati pengalaman manajemen serta pemantauan yang terintegrasi. Kemampuan pemrosesan data AWS Glue tersedia di notebook Amazon SageMaker dan Amazon SageMaker visual ETL.

Kasus Penggunaan

Sederhanakan manajemen pipeline ETL

Hapus manajemen infrastruktur dengan penyediaan otomatis dan manajemen pekerja, serta gabungkan semua kebutuhan integrasi data Anda ke dalam satu layanan.

Pelajari Penskalaan Otomatis AWS Glue selengkapnya

Jelajahi, lakukan eksperimen, dan proses data secara interaktif

Dengan menggunakan sesi interaktif AWS Glue, teknisi data dapat secara interaktif menjelajahi dan mempersiapkan data menggunakan lingkungan pengembangan terintegrasi (IDE) atau notebook pilihan mereka.

Pelajari Sesi Interaktif AWS Glue selengkapnya

Temukan data secara efisien

Identifikasi data di AWS, on-premise, dan cloud lainnya dengan cepat, lalu sediakan data tersebut secara instan untuk pembuatan kueri serta transformasi.

Pelajari Katalog Data AWS Glue selengkapnya

Mendukung berbagai kerangka kerja dan beban kerja pemrosesan

Lebih mudah mendukung berbagai kerangka kerja pemrosesan data, seperti ETL dan ELT, serta beragam beban kerja, termasuk batch, mikro batch, dan streaming.

Pelajari streaming tugas ETL selengkapnya