Kisah Pelanggan/Perangkat Lunak & Internet/Turki
Codeway Menghemat 48% Biaya Komputasi untuk AI Generatif Menggunakan Instans G5 Amazon EC2
Pelajari cara Codeway mengoptimalkan performa harga untuk aplikasi AI generatifnya, Wonder, menggunakan Instans Amazon EC2 G5 yang didukung GPU NVIDIA.
Pengurangan 48%
dalam biaya komputasi
1,5 juta pengguna aktif bulanan
di lebih dari 160 negara
Kurang dari 3,5 bulan
untuk melakukan deployment di AWS
Efisiensi
manajemen operasional
Performa
optimal
Gambaran Umum
Dengan lebih dari 140 juta pengguna di lebih dari 160 negara, Codeway telah memberikan pengaruh yang signifikan dalam dunia aplikasi dan game seluler melalui kekuatan kecerdasan buatan generatif. Seiring pertumbuhan basis penggunanya, Codeway berupaya meningkatkan skalabilitas, elastisitas, dan efisiensi biaya beban kerja yang mendukung teknologi canggih ini.
Setelah menerima rekomendasi dari Amazon Web Services (AWS), Codeway memilih untuk mengadopsi Instans G5 Amazon Elastic Compute Cloud (Amazon EC2) yang didukung oleh GPU NVIDIA A10G Tensor Core, instans berbasis GPU beperforma tinggi untuk machine learning dan aplikasi intensif grafis, untuk menggerakkan aplikasi penghasil gambarnya, Wonder. Dengan mengoptimalkan infrastruktur Wonder di AWS, Codeway telah mempertahankan performa optimal, mengurangi biaya dibandingkan dengan strategi komputasi sebelumnya, dan melakukan penskalaan secara efektif untuk membantu jutaan kreator konten mewujudkan ide mereka.
Peluang | Menskalakan Komputasi untuk AI Generatif sekaligus Menurunkan Biaya untuk Codeway
Berbasis di Istanbul, Turki, Codeway mengembangkan aplikasi dan gim seluler yang didukung oleh teknologi mutakhir, khususnya AI generatif. Aplikasi Wonder-nya mengubah kata-kata menjadi gambar digital; pengguna memasukkan kata atau kalimat, dan Wonder mengubah input tersebut menjadi karya seni dengan melakukan deployment model difusi yang stabil untuk pembuatan gambar berdasarkan PyTorch di AWS. Tergantung dari langganan mereka, pengguna kemudian dapat mengunduh versi gambar berkualitas tinggi atau rendah.
Karena Wonder telah diunduh oleh lebih dari 28,3 juta pengguna, Codeway berupaya memaksimalkan kemampuan komputasi dan GPU-nya. Infrastruktur Wonder didistribusikan ke berbagai penyedia cloud di berbagai wilayah. Untuk beban kerja inferensi kecerdasan buatan (AI), Codeway menggunakan GPU NVIDIA A100 Tensor Core yang di-hosting di salah satu penyedia ini. Namun, ada masalah kapasitas GPU yang memengaruhi performa.
“Beban kerja ini memerlukan perangkat keras yang sangat bergantung pada GPU. Kami juga menambahkan jutaan pengguna tiap bulannya, jadi permintaan kami terhadap GPU akan terus meningkat,” kata Ugur Arpaci, Lead DevOps Engineer di Codeway. “Saat kami bertransisi dari mengelola ratusan GPU menjadi ribuan, kami ingin mengoptimalkan biaya dan performa serta menemukan strategi yang baik untuk skalabilitas.”
Amazon EC2 menawarkan portofolio komputasi yang luas dan mendalam, dengan lebih dari 600 instans dan pilihan prosesor, penyimpanan, jaringan, sistem operasi, dan opsi model pembelian terbaru untuk membantu pelanggan menyesuaikan dengan kebutuhan beban kerja mereka. Saat Codeway mencari cara untuk mengoptimalkan komputasinya, Codeway menemukan solusi ideal: Instans G5 Amazon EC2 yang didukung oleh GPU NVIDIA A10G Tensor Core. Meskipun Codeway memiliki pilihan GPU serupa dengan penyedia cloud lainnya, mereka tidak memberikan ketersediaan dan skalabilitas yang sama seperti AWS.
“Tim AWS menyarankan agar kami dapat mencapai sasaran performa harga dengan mengadopsi Instans G5 Amazon EC2 yang didukung oleh GPU NVIDIA A10G Tensor Core,” kata Arpaci. “Kami mulai mencobanya, dan kami melihat hasil yang bagus.”
Di AWS, kami dapat mengelompokkan beban kerja kami untuk memberikan performa yang lebih baik bagi pengguna kami.”
Ugur Arpaci
Lead DevOps Engineer, Codeway
Solusi | Menjalankan Model Difusi Stabil Berbasis PyTorch untuk Wonder di AWS dalam waktu 3,5 Bulan
Setelah menganalisis performa harga Instans G5 Amazon EC2, Codeway bekerja sama dengan tim AWS untuk menyelesaikan proses orientasi. “Kami selalu berhubungan dengan para ahli di AWS,” kata Arpaci. “Kami mengikuti panduan mereka, lalu melakukan tes dan menghitung biaya di pihak kami. Untuk model tertentu, kami menyadari bahwa kami dapat memperoleh manfaat maksimal dengan melakukan deployment aplikasi kami di Instans G5 Amazon EC2. Kami kemudian membagikan hasil kami dan membangun umpan balik yang sangat positif.”
Proses orientasinya cepat serta lancar, dan dalam waktu 3,5 bulan, Codeway menjalankan beban kerja produksi untuk Wonder di AWS. Kini Codeway menggunakan Instans G5 Amazon EC2 dengan GPU A10G untuk melakukan deployment hampir semua beban kerja inferensi AI untuk Wonder versi gratis. Untuk menghasilkan gambar definisi tinggi penuh bagi pelanggan berbayar, Codeway menggunakan GPU A100 yang lebih bertenaga, yang menghasilkan konten berkualitas lebih tinggi dalam waktu lebih singkat. Dengan menggunakan A10G dan A100, perusahaan dapat mematuhi semua perjanjian tingkat layanan untuk waktu output.
“Kami tahu bahwa A10G kurang bertenaga dibandingkan A100, tetapi beberapa beban kerja tidak memerlukan performa GPU sebanyak itu,” kata Arpaci. “Sekarang, kami dapat mengalihkan sebagian besar beban kerja ini dari GPU kami yang lebih bertenaga, yang saat ini hanya tersedia pada fitur pengguna premium, seperti pembuatan gambar berkualitas tinggi.”
Untuk lebih meningkatkan efisiensi biaya dan performa, Codeway telah mengadopsi klaster di Amazon Elastic Kubernetes Service (Amazon EKS)—layanan terkelola untuk menjalankan Kubernetes di AWS Cloud dan pusat data on-premise—untuk menaikkan dan menurunkan Instans G5 Amazon EC2 secara dinamis sesuai kebutuhan. Solusi penskalaan otomatis kustom telah dilakukan deployment pada setiap klaster Amazon EKS, yang secara cerdas meminta instans tambahan ketika permintaan muncul.
Untuk mengelola instans, Codeway mengandalkan Karpenter, solusi penyediaan simpul sumber terbuka. Layanan ini secara efektif menentukan dan menggunakan tipe instans yang sesuai berdasarkan kebutuhan Codeway. “Karpenter sebenarnya memilih jumlah instans yang diperlukan untuk kami dan melakukan deployment, lalu, lalu kami menambah deployment beban kerja yang diperlukan,” kata Arpaci. “Seluruh proses dilakukan secara otomatis, sehingga menyederhanakan banyak faktor dari sudut pandang operasional.”
Diagram Arsitektur
Hasil | Mengurangi Biaya Komputasi sebesar 48% untuk Menskalakan AI Generatif secara Efektif
Adopsi GPU A10G yang diunggulkan dalam Instans G5 Amazon EC2 berperan penting dalam perjalanan Codeway menuju arsitektur yang lebih hemat biaya, kuat, dan dapat diskalakan. Perusahaan dapat secara efektif melakukan skala untuk memenuhi lonjakan dan penurunan penggunaan, menanggapi permintaan pengguna di seluruh dunia. Kini, jutaan pengguna Wonder menikmati pengalaman yang lebih baik dengan aplikasi dan gim.
“Dengan Instans G5 Amazon EC2 yang didukung GPU NVIDIA A10G Tensor Core, kami dapat memproses sebagian besar beban kerja inferensi AI kami,” kata Arpaci. “Dengan menggunakan akselerator GPU A10G di AWS, kami dapat mengelompokkan beban kerja kami untuk memberikan performa yang lebih baik bagi pengguna kami.”
Di AWS, Codeway mempertahankan performa dan ketersediaan tinggi dengan biaya optimal. Dengan menyesuaikan ukuran Instans G5 Amazon EC2 dan memanfaatkan Instans Spot Amazon EC2, yang menjalankan beban kerja toleransi kesalahan dengan diskon hingga 90 persen dibandingkan harga Sesuai Permintaan, perusahaan mengurangi biaya komputasi sebesar 48 persen dibandingkan dengan menjalankan semua beban kerjanya pada GPU A100. Versi gratis Wonder bertujuan untuk mengubah pengguna menjadi pelanggan berbayar; dengan menurunkan biaya komputasi untuk penawaran gratis, Codeway dapat memperoleh lebih banyak pelanggan dengan harga yang sama.
Codeway nantinya akan menggunakan layanan AWS untuk tetap menjadi yang terdepan dalam AI generatif. Perusahaan berencana untuk memperdalam keterlibatannya dengan AWS di masa mendatang dan mengadopsi layanan baru untuk mendukung komponen infrastruktur lainnya. Misalnya, Codeway mengevaluasi beberapa layanan AWS, seperti AWS Batch—layanan yang memfasilitasi pemrosesan batch, pelatihan model machine learning, dan analisis dalam skala besar—untuk menstandardisasi beban kerja pelatihan AI-nya.
Di AWS, Codeway telah membuat kemajuan besar dengan berhasil mengubah AI generatif menjadi produk. Berkat perjalanan transformatif ini, kerangka kerja AI yang mudah beradaptasi dan tangguh siap mendukung basis pengguna yang terus berkembang.
Tentang Codeway
Berkantor pusat di Istanbul, Turki, Codeway meluncurkan aplikasi seluler yang didukung oleh kecerdasan buatan generatif dan teknologi mutakhir lainnya. Sejak tahun 2020, lebih dari 140 juta pengguna di lebih dari 160 negara telah mengunduh aplikasinya.
Layanan AWS yang Digunakan
Amazon EC2
Amazon Elastic Compute Cloud (Amazon EC2) menawarkan platform komputasi terluas dan terdalam, dengan lebih dari 700 instans dan pilihan prosesor, penyimpanan, jaringan, sistem operasi, serta model pembelian terbaru untuk membantu menyesuaikan dengan kebutuhan beban kerja Anda.
Instans G5 Amazon EC2
Instans G5 Amazon EC2 adalah instans berbasis GPU NVIDIA generasi terbaru yang dapat digunakan untuk berbagai kasus penggunaan padat grafis dan machine learning.
Amazon EKS
Amazon Elastic Kubernetes Service (Amazon EKS) adalah layanan Kubernetes terkelola untuk menjalankan Kubernetes di AWS cloud dan pusat data on-premise.
AWS Batch
AWS Batch memungkinkan pengembang, ilmuwan, dan rekayasawan menjalankan ratusan ribu pekerjaan komputasi batch dan ML secara efisien sambil mengoptimalkan sumber daya komputasi, sehingga Anda dapat fokus menganalisis hasil dan memecahkan masalah.
Kisah Pelanggan AI Generatif Lainnya
Mulai
Organisasi dalam berbagai ukuran di semua industri mentransformasi bisnis mereka dan mewujudkan misi mereka setiap hari menggunakan AWS. Hubungi ahli kami dan mulai perjalanan AWS Anda sendiri sekarang juga.