Apa itu danau data?

Danau data adalah repositori terpusat yang memungkinkan Anda menyimpan semua data terstruktur dan tidak terstruktur dalam skala besar. Anda dapat menyimpan data apa adanya, tanpa harus menyusun data terlebih dahulu, dan menjalankan berbagai tipe analitik—dari dasbor dan visualisasi hingga pemrosesan <i>big</i> data, analisis waktu nyata, dan <i>machine learning</i> untuk memandu keputusan yang lebih baik.

Mengapa Anda memerlukan data lake?

Organisasi yang berhasil menghasilkan nilai bisnis dari datanya, akan memiliki kinerja yang lebih baik dari sesamanya. Sebuah survei Aberdeen mengamati bahwa organisasi yang menerapkan danau data memiliki pertumbuhan pendapatan organik yang mengungguli perusahaan serupa sebesar 9%. Pemimpin perusahaan ini mampu melakukan jenis analisis baru seperti machine learning pada sumber baru seperti file log, data dari situs web yang sering diakses, media sosial, dan perangkat terhubung internet yang disimpan di data lake. Ini membantu mereka untuk mengidentifikasi, dan mengambil kesempatan untuk pertumbuhan bisnis yang lebih cepat dengan menarik dan mempertahankan pelanggan, meningkatkan produktivitas, secara proaktif menjaga perangkat, dan membuat keputusan yang diinformasikan.

Apa saja elemen penting dari danau data dan solusi analitik?

Ketika organisasi membuat danau data dan platfom analitik, organisasi tersebut perlu mempertimbangkan sejumlah kemampuan kunci yang mencakup:

Perpindahan data

Danau data memungkinkan Anda mengimpor berapa pun jumlah data yang dapat tersedia secara waktu nyata. Data dikumpulkan dari berbagai sumber, dan dipindahkan ke data lake dalam format aslinya. Proses ini memungkinkan Anda menskalakan data pada ukuran berapa pun, sementara menghemat waktu penentuan struktur, skema, dan transformasi data.

Menyimpan dan membuat katalog data secara aman

Danau data memungkinkan Anda menyimpan data relasional, seperti basis data operasional dan data dari lini aplikasi bisnis, serta data nonrelasional, seperti aplikasi seluler, perangkat IoT, dan media sosial. Data lake juga memberi Anda kemampuan untuk memahami data apa yang ada di dalam lake melalui crawling, katalogisasi, dan pengindeksan data. Akhirnya, data harus diamankan untuk memastikan aset data Anda terlindungi.

Analisis

Danau data memungkinkan berbagai peran di organisasi Anda, seperti ilmuwan data, developer data, dan analis bisnis untuk mengakses data dengan pilihan alat dan kerangka kerja analitik. Hal ini mencakup kerangka kerja sumber terbuka, seperti Apache Hadoop, Presto, dan Apache Spark, serta penawaran komersial dari gudang data dan vendor kecerdasan bisnis. Danau data memungkinkan Anda menjalankan analitik tanpa perlu memindahkan data ke sistem analitik terpisah.

Baca tentang Analitik Data »

Machine Learning

Danau data akan memungkinkan organisasi untuk menghasilkan berbagai jenis wawasan termasuk melaporkan data historis, dan melakukan machine learning di mana model dibangun untuk memprakirakan hasil yang mungkin terjadi dan menyarankan berbagai tindakan yang ditentukan untuk mencapai hasil yang optimal.

Baca tentang Machine Learning »

Bagaimana gudang data dibandingkan dengan danau data?

Tergantung pada persyaratan, organisasi biasanya akan memerlukan gudang data dan data lake karena keduanya melayani kebutuhan dan kasus penggunaan yang berbeda.

Gudang data adalah database yang dioptimalkan untuk menganalisis data relasional yang datang dari sistem transaksi dan lini aplikasi bisnis. Struktur dan skema data ditetapkan terlebih dahulu untuk mengoptimalkan kueri SQL yang cepat, di mana hasil biasanya digunakan untuk pelaporan dan analisis operasional. Data dibersihkan, diperkaya, dan ditransformasi sehingga dapat berfungsi sebagai “sumber kebenaran tunggal” yang dapat dipercaya oleh pengguna.

Baca mengenai gudang data »

Data lake berbeda, karena menyimpan data relasional dari lini aplikasi bisnis, dan data non-relasional dari aplikasi seluler, perangkat IoT, dan media sosial. Struktur atau skema data tidak ditetapkan pada saat data diambil. Artinya, Anda dapat menyimpan semua data Anda tanpa rancangan yang akurat atau perlunya untuk mengetahui pertanyaan apa yang perlu dijawab di kemudian hari. Jenis analisis yang berbeda pada data Anda seperti kueri SQL, analisis big data, pencarian teks penuh, analisis real-time, dan machine learning dapat digunakan untuk menjelaskan yang perlu dipahami.

Karena organisasi dengan gudang data mengetahui manfaat dari data lake, organisasi tersebut mengembangkan gudang datanya untuk memasukkan data lake, dan memungkinkan kemampuan kueri yang beragam, kasus penggunaan pengetahuan data, dan kemampuan tingkat lanjut untuk menemukan model informasi baru. Gartner menyebut evolusi ini sebagai “Solusi Manajemen Data untuk Analisis” atau “DMSA.”

Untuk perbandingan mendalam antara danau data dan gudang data, kunjungi halaman perbandingan khusus kami untuk danau data vs. gudang data.

Apa nilai dari danau data?

Kemampuan untuk memanfaatkan lebih banyak data, dari lebih banyak sumber, dalam waktu yang lebih singkat, dan mendorong pengguna untuk berkolaborasi dan menganalisis data secara berbeda mengakibatkan pembuatan keputusan yang lebih baik dan lebih cepat. Contoh dimana Danau data memiliki nilai tambah meliputi:

Peningkatan interaksi pelanggan

Danau data dapat menggabungkan data pelanggan dari platform CRM dengan analitik media sosial, platform pemasaran yang mencakup riwayat pembelian, dan tiket insiden untuk mendorong bisnis agar memahami kohort pelanggan yang paling menguntungkan, penyebab churn pelanggan, dan promosi atau hadiah yang akan meningkatkan loyalitas.

Meningkatkan pilihan Inovasi R&D

Data lake dapat membantu tim R&D Anda menguji hipotesis mereka, memperbaiki asumsi, dan menilai hasil—seperti memilih bahan yang tepat pada rancangan produk Anda yang membuat kinerja yang lebih cepat, melakukan riset genomik untuk pengobatan yang lebih efektif, atau memahami kerelaan pelanggan untuk membeli atribut berbeda.

Meningkatkan efisiensi operasional

Internet of Things (IoT) memperkenalkan lebih banyak cara untuk mengumpulkan data pada proses seperti produksi, dengan data real-time yang berasal dari perangkat yang terhubung ke internet. Data lake memudahkan untuk menyimpan, dan menjalankan analisis pada data IoT yang dihasilkan oleh mesin untuk menemukan cara mengurangi biaya operasional, dan meningkatkan kualitas.

Pelajari mengenai Internet untuk Segala (IoT) »

Apa saja tantangan danau data?

Tantangan utama dengan arsitektur data lake adalah bahwa data mentah disimpan tanpa kekeliruan konten. Agar data lake membuat data dapat digunakan, maka perlu memiliki mekanisme yang ditetapkan untuk mengatalogkan, dan mengamankan data. Tanpa elemen ini, data tidak dapat ditemukan atau dipercaya, yang menghasilkan “data swamp". Memenuhi kebutuhan audiens yang lebih luas, data lake perlu memiliki perintah, konsistensi semantis, dan kontrol akses.

Bagaimana cara melakukan deployment danau data di cloud?

Danau data adalah beban kerja yang ideal untuk dilakukan deployment di cloud, karena cloud memberikan performa, skalabilitas, keandalan, ketersediaan, beragam set mesin analitik, dan skala ekonomi yang masif. Riset ESG menemukan bahwa 39% responden menganggap cloud sebagai deployment analisis yang utama, 41% untuk gudang data, dan 43% untuk Spark. Alasan terbanyak pelanggan menganggap cloud sebagai keuntungan untuk Danau data adalah keamanan yang lebih baik, waktu deployment yang lebih cepat, ketersediaan yang lebih baik, pembaruan fitur/fungsionalitas yang lebih sering, elastisitas yang lebih banyak, cakupan geografis yang lebih luas, dan biaya yang terkait dengan penggunaan aktual.

Bagaimana AWS dapat mendukung kebutuhan danau data Anda?

AWS menyediakan portofolio layanan yang paling aman, dapat diskalakan, komprehensif, dan hemat biaya yang memungkinkan pelanggan membuat data lake mereka di cloud, menganalisis semua data, termasuk data dari perangkat IoT dengan beragam pendekatan analitis termasuk machine learning. Sehingga, ada lebih banyak organisasi yang menjalankan data lake dan analisisnya di AWS dibandingkan dengan tempat lain dengan pelanggan seperti NETFLIX, Zillow, NASDAQ, Yelp, iRobot, dan FINRA yang memercayakan AWS untuk menjalankan beban kerja analisis kritis bisnis mereka.

Mulai danau data di AWS dengan membuat akun sekarang juga.

Langkah Berikutnya di AWS

Lihat sumber daya terkait produk tambahan
Lihat penawaran gratis untuk layanan Analitik di cloud 
Daftar untuk akun gratis

Dapatkan akses secara instan ke AWS Tingkat Gratis.

Daftar 
Mulai membangun di konsol

Mulai membangun di konsol manajemen AWS.

Masuk