Temui Astro, Layanan Apache Airflow yang dikelola oleh astronom yang dibuat dan di-hosting di AWS

Bagaimana konten ini?

Agar data berguna dalam korporasi modern, data harus dikumpulkan dan dipusatkan dari berbagai sumber, lalu diproses di seluruh ekosistem alat yang berkembang, dan diumpankan ke sistem di seluruh organisasi dengan cara yang dapat digunakan di seluruh tim. Orkestrasi data ini, yang menenun logika bisnis melalui tumpukan data untuk segala hal mulai dari dasbor hingga algoritma personalisasi, membutuhkan ratusan, bahkan ribuan, alur data.

Orkestrasi data diperlukan di semua industri, dalam organisasi dari semua ukuran. Dengan lebih dari 2.200 kontributor dan lebih dari 12 juta unduhan bulanan, Apache Airflow telah muncul sebagai standar sumber terbuka untuk pembuatan, penjadwalan, dan pemantauan alur data secara terprogram. Praktisi data menyukai Airflow karena komunitasnya, fleksibilitasnya, dan kemampuannya untuk menyediakan tampilan sentral dari ekosistem data.

Namun, tim data secara alami membutuhkan lebih dari sekadar Airflow sumber terbuka. Mereka membutuhkan alur pengujian untuk memastikan kualitas data, SDK untuk membuat praktisi data produktif, dan observabilitas ditambah silsilah data yang mendasarinya, bahkan saat mereka berusaha meminimalkan biaya tambahan operasional. Silsilah data menyediakan konteks lengkap data dengan menangkap secara lebih detail hubungan antara sumber data, asal data, serta bagaimana data itu diubah dan dikonvergensi melalui siklus hidup data.

Memenuhi kebutuhan orkestrasi data modern

Astronomer, yaitu startup yang didirikan pada tahun 2018, telah menghabiskan lima tahun terakhir untuk memajukan Airflow sebagai proyek sumber terbuka dengan alat yang membantu praktisi data mendapatkan hasil maksimal dari orkestrasi data dan silsilah data. Produk unggulan Astronomer, yaitu Astro, memungkinkan pelanggan untuk membangun, menjalankan, dan mengamati alur data di Airflow sebagai layanan terkelola, yang memungkinkan tim data menghabiskan lebih banyak waktu untuk berfokus pada penulisan logika bisnis dan memperluas akses ke data.

“Banyak proses bisnis fundamental yang diatur Astro untuk pelanggan kami didukung oleh Amazon Web Services (AWS): Amazon Simple Storage Service (Amazon S3), Amazon Redshift, Amazon EMR, Amazon SageMaker, dan banyak lainnya,” jelas Viraj Parekh, Astronomer's Field CTO.

Didirikan bersama oleh tim kecil yang terdiri dari tiga orang teman, yaitu Paola Peraza Calderon, Pete DeJoy, dan Viraj Parekh, Astronomer menggambarkan misinya saat ini sebagai tiga lipatan:

  • Membuat produk yang meningkatkan nilai yang diperoleh tim data dari orkestrasi data dan silsilah data.
  • Memperkuat pertumbuhan organik dari proyek sumber terbuka Airflow dan komunitasnya.
  • Menyediakan pendidikan, praktik terbaik, dan dukungan kepada praktisi data yang memungkinkan kesuksesan mereka dengan data.

Dengan lebih dari 350 karyawan dan tim yang didistribusikan secara global, baik Astronomer maupun basis pelanggannya telah berkembang pesat. “Astronomer dimulai dengan orang-orang yang menjalankan Airflow sumber terbuka dan meminta bantuan kami untuk mengelola infrastruktur di baliknya,” kata Pete. “Sekarang setelah kami menyelesaikan manajemen infrastruktur, kami berfokus pada serangkaian kemampuan yang lebih luas yang diperlukan untuk menggunakan Airflow dan menggunakannya sebagai fondasi untuk platform orkestrasi yang lengkap.”

Membangun dan menskalakan di AWS

Kebutuhan pasar akan produk Astronomer, serta potensi kesuksesan perusahaan, sudah terbukti sejak awal. Viraj tertawa saat dia berbagi cerita tentang masa-masa awal mereka. “Kami semua terlibat langsung dalam pembuktian konsep dengan perusahaan game besar. Perusahaan mengandalkan Astronomer untuk mengatur aliran data untuk peluncuran terbesarnya tahun ini. Pagi hari setelah peluncuran, tidak ada tiket dukungan,” kata Viraj. “Dan saya berpikir, 'Oh tidak, apakah ada yang salah?' Ternyata, semua berjalan lancar. Semuanya berhasil. Kami menangani 100% dari penyerapan data yang berasal dari salah satu peluncuran terbesar perusahaan ini, dan semuanya berjalan lancar.”

Mengapa Astronomer membangun startup miliknya di AWS? “Saya tidak bisa bilang itu keputusan. Namun, Itu adalah pilihan yang jelas karena AWS telah menjadi landasan strategi cloud kami,” kata Paola. “Sebagai dasar, keberadaan layanan AWS di mana pun di seluruh negara dan wilayah memungkinkan kami untuk bekerja dengan organisasi di seluruh dunia. Layanan AWS dengan sendirinya membuka pasar kami.”

Untuk memenuhi kebutuhan basis pelanggannya yang semakin luas, Astronomer membangun antarmuka yang memungkinkan praktisi data untuk mendapatkan hasil maksimal dari Airflow saat mereka mengembangkan alur data dan membentuk tampilan tunggal ekosistem mereka. Viraj menjelaskan: “Kami menggabungkan orkestrasi data melalui sistem apa pun yang Anda inginkan, yaitu menggunakan alat dan layanan apa pun yang digunakan tim Anda, dengan silsilah data. Anda tidak hanya dapat mengatur data di semua sistem Anda, tetapi Anda dapat melihat bagaimana data itu bergerak.”

Seperti yang ditunjukkan dalam diagram arsitektur, Astro dibangun dengan arsitektur multibidang yang terdiri dari bidang kendali yang di-hosting oleh Astronomer dan bidang data yang dapat berjalan di cloud Anda atau di akun penghuni tunggal yang di-hosting oleh Astronomer:

Seiring pertumbuhan Astronomer, perusahaan telah meningkatkan jejak AWS untuk memenuhi kebutuhan pelanggannya. Saat ini, Astronomer mengandalkan Amazon Elastic Kubernetes Service (Amazon EKS) untuk menjalankan Astro sebagai layanan terkelola dalam jaringan perusahaan pelanggan, dan mendukung alat seperti AWS Transit Gateway dan AWS Private Link untuk terhubung dengan aman ke layanan data lain di jaringan mereka. Astro menggunakan AWS CloudFormation untuk menyediakan klaster Kubernetes baru dan Amazon S3 untuk menyimpan log, dan agar tipe instans simpul tersedia bagi pelanggan untuk memilih perangkat keras yang paling optimal dalam menjalankan alur mereka. Hal ini memberi opsionalitas, performa, dan efisiensi bagi praktisi data di mana mereka membutuhkannya.

“Kami yakin bahwa seiring pertumbuhan pasar dan basis pelanggan kami, AWS dapat tumbuh bersama kami. Mampu menyempurnakan layanan AWS agar sesuai dengan kebutuhan kami dapat membantu kami menjadikan Astro lebih cepat, lebih hemat biaya, dan lebih mudah dijalankan oleh pelanggan kami,” kata Paola.

Membangun startup yang sukses

Untuk startup yang ingin meniru kesuksesan mereka, tim pendiri Astronomer setuju bahwa menyediakan waktu bersama pengguna awal produk adalah hal yang penting. Hal ini menciptakan lingkaran umpan balik yang ketat yang meningkatkan produk Anda sejak dini, dan seringkali menghasilkan hubungan pribadi yang kuat yang akan memandu Anda sepanjang perjalanan membangun perusahaan.

“Khusus untuk startup tahap awal, orang yang menggunakan produk Anda terlebih dahulu kemungkinan besar akan memahami masalah yang Anda coba selesaikan. Kuratori hubungan tersebut dari waktu ke waktu karena pelanggan ini telah memikirkan masalah Anda dan menggunakan solusi Anda selama Anda masih ada."- Viraj Parekh

“Ajukan banyak pertanyaan, dan kerjakan. Begitu banyak yang menganggap bahwa membawa perusahaan melalui tahap awal adalah tentang menyingsingkan lengan baju Anda, membiarkan diri Anda mengulang, dan mengumpulkan tim kecil di bersama Anda. Meskipun terdengar sederhana, tetapi eksekusi pada akhirnya menentukan begitu banyak usaha yang sukses.” – Paola Peraza Calderon

“Ketika perusahaan Anda tumbuh, daftar hal-hal yang harus dilakukan tidak akan pernah berakhir. Ini adalah keterampilan nyata untuk belajar cara mengidentifikasi item prioritas tinggi yang ada dalam daftar dan fokus untuk mencapainya.” – Pete DeJoy

Apa langkah Astronomer selanjutnya?

Mengenai langkah Astronomer selanjutnya, Pete menjelaskan: “Kami ingin membangun perusahaan generasi yang menciptakan nilai pelanggan yang nyata, sembari menumbuhkan bakat di antara karyawan kami, dan memungkinkan mereka untuk mengaktualisasikan diri dalam karier mereka. Dan kita akan mencapainya dengan mendorong hasil pelanggan yang nyata dan berarti setiap hari.”

Paola Peraza Calderon

Paola Peraza Calderon

Paola adalah product manager dan co-founder Astronomer. Dia mengemban berbagai peran dan tanggung jawab selama lebih dari 5 tahun bekerja di Astronomer, tetapi tugas utamanya adalah manajemen produk dan dokumentasi developer. Dia menampilkan performa terbaiknya dengan mengurasi pengalaman developer di seluruh layanan cloud Astronomer dan memimpin tim penulis teknis untuk membuat rekayasa data lebih mudah diakses. Paola adalah lulusan Georgetown University dan menghabiskan 5 tahun di Cincinnati, Ohio, sebagai Venture for America Fellow. Berasal dari Mexico City, saat ini dia tinggal di Brooklyn dan bersemangat untuk terus menumbuhkan jejak Astronom.

Ganapathi Krishnamoorthi

Ganapathi Krishnamoorthi

Ganapathi Krishnamoorthi adalah Senior ML Solutions Architect di AWS. Ganapathi memberikan panduan preskriptif kepada pelanggan Startups dan korporasi dengan membantu mereka merancang dan menerapkan aplikasi cloud dalam skala besar. Dia berspesialisasi di bidang machine learning dan fokus untuk membantu pelanggan memanfaatkan AI/ML untuk hasil bisnis mereka. Di waktu luangnya, dia senang menjelajahi alam dan mendengarkan musik.

Megan Crowley

Megan Crowley

Megan Crowley adalah Senior Technical Writer di Tim Konten Startups di AWS. Mengawali kariernya sebagai guru bahasa Inggris di sekolah menengah atas, dia memiliki antusiasme yang tinggi untuk berkontribusi pada konten yang mendidik dan menginspirasi. Berbagi kisah Startups dengan dunia adalah bagian paling berharga dari perannya di AWS. Di waktu luangnya, Megan kerap menghabiskan waktu dengan membuat kerajinan kayu, berkebun, dan berbelanja di pasar barang antik.

Pete DeJoy

Pete DeJoy

Pete adalah hands-on product manager dan co-founder di Astronomer. Dia bekerja untuk memecahkan masalah rekayasa data selama lima tahun belakangan. Sepanjang kariernya, dia telah menyelesaikan hampir semua pekerjaan, tetapi dia memiliki minat yang besar pada inovasi teknologi dan kesesuaian produk/pasar. Pada masa studinya, dia bermain sepak bola di tingkat perguruan tinggi dan merupakan pembalap ski yang kompetitif. Dia menghabiskan tahun-tahun akademiknya bergelut dengan fisika dan kimia, tetapi sebagian besar beban pikirannya kemudian digantikan dengan Stack Overflow.

Viraj Parekh

Viraj Parekh

Viraj memimpin upaya ekosistem dan merupakan co-founder Astronom. Selama lebih dari 6 tahun bekerja di Astronomer, dia membantu membangun dan mengelola produk, membantu memenangkan pelanggan, dan meningkatkan tim di seluruh organisasi. Saat ini, dia fokus untuk menciptakan pengalaman kelas satu dengan Airflow/Astronomer dan tumpukan data lainnya. Sebelum menjadi warga Brooklyn, Viraj menghabiskan 3 tahun tinggal di Cincinnati, Ohio, sebagai Venture for America Fellow.

Bagaimana konten ini?