Pengamatan

Dapatkan wawasan dan tingkatkan performa aplikasi, pengguna, dan infrastruktur Anda

Apa yang dimaksud dengan pengamatan?

“Apakah sistem saya naik atau turun?” “Apakah sistem saya cepat atau lambat seperti yang dialami oleh pengguna akhir saya?” “KPI dan SLA apa yang harus kita tetapkan, dan bagaimana kita tahu jika sudah terpenuhi?” Saat beroperasi pada kecepatan dan skala cloud, Anda tidak dapat menduga-duga: Anda harus mampu menjawab berbagai pertanyaan operasional dan bisnis seperti ini. Anda harus mampu menemukan masalah saat muncul (idealnya sebelum mengganggu pengalaman pelanggan), menanggapi dengan cepat, dan menyelesaikan secepat mungkin. Untuk mencapai wawasan ini, Anda perlu sistem yang dapat diamati.

Pemantauan dan Pengamatan

“Pengamatan” menjelaskan seberapa baik Anda dapat memahami apa yang terjadi dalam sistem, sering kali dengan memberikan instrumen untuk mengumpulkan metrik, log, atau jejak. Di cloud, pengamatan dapat sulit dicapai karena kerumitan sistem. Baik itu di pusat data maupun di cloud, untuk mencapai keunggulan operasional dan memenuhi tujuan bisnis, Anda perlu memahami bagaimana sistem Anda berjalan. Solusi pengamatan memungkinkan Anda untuk mengumpulkan dan menganalisis data dari aplikasi dan infrastruktur sehingga Anda dapat memahami status internal dan mendapat pemberitahuan, memecahkan masalah, dan mengatasi masalah dengan ketersediaan aplikasi dan performa untuk meningkatkan pengalaman pengguna-akhir. 

Apa perbedaan antara pengamatan dan pemantauan?

Meski pun istilah "pemantauan" kadang-kadang didefinisikan berbeda dari pengamatan, pemantauan adalah aktivitas yang membuat sistem dapat diamati, di samping aktivitas lain seperti penelusuran dan pencatatan. Anda akan sering melihat pemantauan, pelacakan, dan pencatatan yang dijelaskan sebagai “tiga pilar pengamatan.” Namun, juga terdapat alat lain yang membantu Anda mencapai pengamatan, seperti pembuatan profil dan AI/Ops, yang didiskusikan di bawah.

Pengamatan dapat membantu saya dalam hal apa saja?

Pengamatan memungkinkan Anda mendeteksi dan menyelidiki masalah.

Deteksi

Deteksi masalah tepat waktu (idealnya sebelum memengaruhi pengguna akhir) adalah langkah pertama dalam pengamatan. Deteksi harus proaktif dan multifaset, termasuk alarm saat ambang batas performa dilanggar, pengujian sintetik, dan deteksi anomali. Metrik performa umum berarti waktu untuk mendeteksi (MTTD). Anda dapat meningkatkan MTTD dengan jumlah aktivitas dan alat:


Pemantauan

Alat pemantauan mencatat statistik performa seiring waktu sehingga pola penggunaan dapat diidentifikasi. Agen pemantauan mencatat metrik yang dipilih pada interval yang diatur dan menyimpan data yang dihasilkan dalam format seri waktu.

Pemantauan Performa Aplikasi

Pemantauan Performa Aplikasi (APM) memungkinkan Anda memantau pengalaman pelanggan ujung-ke-ujung, dari peramban dan perangkat seluler melalui berbagai lapisan tumpukan aplikasi. APM dimulai dengan pemantauan Ujung-depan – mengukur dan memantau pengalaman pelanggan dari peramban atau perangkat seluler. Pada inti dari APM, penemuan, pelacakan, dan diagnostik Aplikasi adalah kemampuan untuk mengidentifikasi bagian aplikasi mana yang menyebabkan masalah performa dan dengan cepat melakukan pinpoint pada alasan masalah tersebut.

Pemberitahuan

Saat ada yang bermasalah, Anda ingin pemberitahuan yang tepat waktu. Namun, deteksi yang terlalu sensitif dapat mengarah pada kelelahan alarm sehingga manajemen alarm juga menjadi kunci.

AI/Ops dan deteksi anomali

Generasi alat terbaru sekarang mendayai kecerdasan buatan dan machine learning untuk menanggung pengamatan, menggunakan model machine learning untuk mengidentifikasi perilaku aplikasi yang ganjil dan masalah kritis permukaan sebelum dapat menyebabkan pemadaman potensial atau gangguan layanan.

Pemantauan infrastruktur

Pemantauan infrastruktur memungkinkan Anda menghubungkan metrik dan log dari tumpukan infrastruktur untuk memahami dan menyelesaikan akar penyebab masalah performa.

Pemantauan pengalaman digital

Pemantauan pengalaman digital (DEM) memberikan wawasan ke pengalaman pengguna akhir yang terlibat dengan sistem dengan mengumpulkan aktivitas dari peramban, aplikasi seluler, atau interaksi suara mereka. Transaksi sintetik melibatkan pembuatan skrip untuk meniru sikap pengguna akhir saat berinteraksi dengan sistem, sehingga dapat dipantau dan diuji bahkan saat tidak dalam beban nyata. Pemantauan pengguna nyata (RUM) mengombinasikan pemantauan ketersediaan situs web atau API untuk menerima permintaan dari points of presence yang berbeda di seluruh dunia, dengan pengujian A/B otomatis.

Pembuatan profil

Alat pembuatan profil mengambil sampel pengukuran dalam interval reguler. Misalnya, unit pemrosesan utama (CPU) umumnya dibuat profil dengan mengambil sampel interval-waktu dari jalur kode di CPU.

Telemetri

Telemetri adalah instrumentasi sistem (biasanya melalui agen pemantauan) agar mereka dapat mengumpulkan data tentang cara sistem tersebut bekerja. Setelah telemetri terpasang, sistem mulai memproduksi data yang dapat dipantau. Meski demikian, tim yang berbeda di dalam perusahaan dapat menggunakan alat yang berbeda, yang telah menyebabkan proliferasi agen pemantauan yang harus disertakan dalam basis kode perusahaan, atau Anda harus menginstrumentasikan kembali jika Anda memutuskan untuk menggunakan alat yang berbeda atau tambahan. Proyek OpenTelemetry memungkinkan instrumentasi aplikasi hanya sekali dan mengirim metrik dan jejak yang berkorelasi ke beberapa solusi pemantauan.

Investigasi

Investigasi adalah fase yang paling menguras waktu dari peristiwa operasional. Ketika terjadi kesalahan, akan sulit memahami apa yang paling penting untuk diperbaiki. Menggunakan beberapa sumber daya pengamatan secara bersamaan dapat membantu Anda memahami akar permasalahan dengan cepat, namun untuk melakukannya secara efektif Anda perlu menghubungkan data di seluruh metrik, log, dan jejak. 


Pelacakan

Pelacakan mencatat peristiwa sistem, seperti permintaan HTTP dari pelanggan. Pada pelacakan terdistribusi, perincian yang ditangkap tentang peristiwa tersebut mencakup jalur permintaan di seluruh layanan/aplikasi, bersama dengan metrik tentang permintaan seperti latensi pada setiap langkah.

Alat Visualisasi

Pengamatan, terutama pada skala cloud, dapat menghasilkan volume data yang sangat besar yang menjadi sulit diurai oleh manusia. Alat visualisasi membantu memahami data dengan cepat dengan menghubungkan data yang dapat diamati ke dalam tampilan grafik yang intuitif.

Kapan saya menggunakan pengamatan?

Memahami status dan performa aplikasi untuk meningkatkan pengalaman pelanggan

Tujuan utama pengamatan adalah mengetahui apa yang terjadi - di mana saja - di sistem Anda agar dapat memastikan pengalaman terbaik bagi pengguna akhir. Anda ingin mendeteksi masalah dengan cepat, menyelidikinya secara efisien, dan memperbaikinya sesegera mungkin untuk meminimalkan waktu henti dan gangguan lain pada pelanggan Anda; metrik umum adalah waktu rata-rata untuk pemulihan.

Tingkatkan produktivitas developer

Proses debug tradisional – dengan menganalisis log, atau menginstrumentasi breakpoint ke dalam kode - merupakan hal membosankan, berulang, dan memakan waktu, serta tidak diskalakan dengan baik untuk aplikasi produksi atau yang dibuat menggunakan layanan mikro atau arsitektur serverless. Untuk menganalisis performa di seluruh aplikasi terdistribusi, developer memerlukan metrik dan pelacakan yang berkorelasi untuk mengidentifikasi dampak pengguna dari sumber mana pun, dan untuk menemukan jalur kode yang rusak atau mahal secepat mungkin. Mereka juga perlu melakukan semua ini tanpa harus menginstrumentasikan kembali kode saat ingin menambahkan alat pengamatan baru ke perangkat mereka. Rangkaian alat pengamatan yang tepat dapat membantu developer memberi kode dan menguji dengan lebih baik dan lebih cepat.

Meningkatkan efektivitas dan efisiensi operasional

Pengamatan dapat membantu Anda menemukan peningkatan performa dalam armada cloud Anda yang pada akhirnya memungkinkan Anda mengurangi biaya. Misalnya, di seluruh ribuan atau ratusan ribu instans, beberapa persen peningkatan performa pada sejumlah CPU yang digunakan oleh suatu aplikasi akan menambahkan jutaan dolar ke dalam penghematan. Begitu pula, dengan menggunakan pengamatan untuk memahami dan memprediksi kebutuhan kapasitas Anda di masa mendatang, Anda dapat memanfaatkan penghematan biaya yang tersedia dari penyimpanan dan harga spot.

Solusi pengamatan apa yang ditawarkan oleh AWS?

Layanan AWS

Solusi pengamatan natif AWS kami telah dikembangkan dari dasar untuk mengamati layanan AWS lain, untuk mengoperasikan skala cloud, dan untuk memberikan keamanan tingkat korporasi.

CloudWatch mengumpulkan data pemantauan dan operasional dalam bentuk log, metrik, dan peristiwa, menyediakan data dan wawasan yang dapat ditindaklanjuti untuk memantau aplikasi Anda, merespons perubahan performa di seluruh sistem, dan mengoptimalkan pemanfaatan sumber daya.

Lakukan pelacakan terdistribusi di beberapa aplikasi dan sistem untuk membantu menemukan latensi di dalam suatu sistem dan menargetkannya untuk peningkatan.

Temukan jalur kode yang paling CPU-intensif dalam aplikasi menggunakan grafik api, dan optimalkan kode Anda untuk meningkatkan performa dan mengurangi biaya infrastruktur. 

Secara otomatis menyerap data operasional dari aplikasi AWS Anda dan menerapkan model machine learning yang diinformasikan oleh keunggulan Amazon.com dan operasional AWS selama bertahun-tahun untuk mengidentifikasi perilaku aplikasi yang tidak wajar dan memunculkan permasalahan kritis sebelum mereka menyebabkan pemadaman atau gangguan layanan.

Sumber terbuka

Kami menawarkan layanan berdasarkan dan sepenuhnya kompatibel dengan perangkat lunak pengamatan sumber terbuka yang populer. Anda dapat terus menggunakan alat yang sudah dikenal yang telah Anda investasikan, sambil menghindari peningkatan berat penskalaan dan keamanan yang tidak berbeda.

Distribusi proyek OpenTelemetry yang aman, siap produksi, dan didukung AWS. Gunakan distribusi ini untuk menginstrumenkan aplikasi Anda sekali saja guna mengirim metrik dan jejak yang berhubungan ke beberapa solusi AWS dan pemantauan mitra.

Layanan pemantauan terkelola berdasarkan dan kompatibel dengan Prometheus, solusi pemantauan dan pemberitahuan sumber terbuka populer yang dioptimalkan untuk lingkungan kontainer. Gunakan bahasa kueri Prometheus (PromQL) untuk memantau performa beban kerja terkontainerisasi.

 Layanan terkelola penuh yang berbasis di Grafana, platform analitik sumber terbuka yang populer. Ajukan kueri, visualisasikan, beri pemberitahuan, dan pahami metrik terlepas dari lokasi penyimpanannya. Buat, jelajahi, dan bagikan dasbor observabilitas.

Amazon OpenSearch Service memudahkan Anda untuk melakukan analitik log interaktif, pemantauan aplikasi secara waktu nyata, pencarian situs web, dan masih banyak lagi. OpenSearch adalah sumber terbuka, pencarian terdistribusi dan suite analitik yang berasal dari Elasticsearch. Amazon OpenSearch Service menawarkan OpenSearch versi terbaru, dukungan untuk 19 versi Elasticsearch (versi 1.5 hingga 7.10), dan kemampuan visualisasi yang didukung oleh Dasbor OpenSearch dan Kibana (versi 1.5 hingga 7.10).

Kisah pelanggan

Mapbox

Mapbox

Mapbox adalah platform pemetaan sumber terbuka untuk peta yang dirancang khusus yang menjangkau lebih dari 300 juta orang tiap bulan. Mapbox menggunakan Amazon CloudWatch untuk penyerapan beberapa sumber data—termasuk metrik AWS asli, metrik kustom, dan log—serta pemantauan dan visualisasi beban kerja utama dan pengoptimalan sumber daya.

“Kami ingin menggabungkan semua pemantauan, pembuatan log, metrik, dan peringatan dalam satu alat. CloudWatch membantu kami meringankan beban operasional untuk menyiapkan, mengonfigurasi, dan mempelajari sistem pihak ketiga. Tim kami menggunakan CloudWatch secara ekstensif untuk memantau tingkat kesalahan dan kode status untuk beberapa beban kerja profil tinggi. Kami juga menggunakan CloudWatch untuk mengotomatiskan tindakan Auto Scaling, yang memungkinkan kami mengoptimalkan biaya jenis instans Amazon EC2 yang mendukung kluster Amazon ECS kami. CloudWatch Events memungkinkan kami memberikan informasi penggunaan dan harga kepada tim agar mereka dapat mengaudit keamanan akun, memicu tindakan AWS Lambda untuk kasus penggunaan kepatuhan dan keamanan, dan menjadwalkan sumber daya kami menggunakan cloud. CloudWatch memungkinkan otomatisasi tingkat berikutnya dan memperluas kapasitas setiap individu.”

Emily McAfee, Manajer Teknisi Platform (Platform Engineering Manager) - Mapbox

Pushpay

Pushpay

Tujuan Pushpay adalah menyatukan orang dengan memperkuat komunitas, koneksi, dan kepemilikan. Kami membangun solusi berbagi dan penerbitan aplikasi seluler kelas dunia untuk membantu organisasi mengembangkan komunitasnya.

“Solusi analitik log kami saat ini memerlukan overhead penyiapan dan pemeliharaan, memiliki persyaratan retensi yang berbeda, dan biaya yang mahal, sehingga tim Teknisi kami tidak dapat mengakses dan meminta log di lingkungan pengembangan dan pengujian. Dengan CloudWatch Logs Insights, sekarang kami dapat meminta log dalam CloudWatch Logs untuk mengurangi kompleksitas operasional. Bayar per kueri memberi kami fleksibilitas untuk menskalakan dengan kecepatan kami sendiri dan teknisi kami dapat mulai menggunakan dan meminta log tanpa menunggu penyiapan, integrasi, dan penyerapan dengan solusi kami saat ini. Kami juga mendapatkan manfaat dari penampilan metrik dan log yang memungkinkan pemecahan masalah yang lebih cepat. Logs Insights adalah solusi yang efektif dan murah bagi teknisi kami untuk memantau aplikasi mereka dan melakukan penyelaman log, semuanya dari satu konsol AWS.”

Peter Goodman, Direktur Teknisi Keandalan Situs (Director Site Reliability Engineering) - Pushpay

SendGrid

SendGrid

SendGrid adalah penyedia email cloud dan mengirimkan lebih dari 40 miliar email tiap bulan untuk lebih dari 69.000 pelanggan yang membayar. SendGrid mengadopsi Amazon CloudWatch di awal migrasi ke AWS untuk mendapatkan visibilitas sistem, wawasan operasional, dan pengoptimalan sumber daya.

“CloudWatch memungkinkan kami mengumpulkan metrik dari layanan AWS seperti Amazon EC2, Amazon Kinesis, Amazon DynamoDB, dan Amazon API Gateway, serta log dari fungsi AWS Lambda. Kami menghargai kemampuan untuk berintegrasi secara alami, tanpa memerlukan tumpukan yang dikelola sendiri atau vendor SaaS pihak ketiga. Ini membantu kami memulai peringatan, auto scaling, dan perencanaan kapasitas dengan sangat cepat. Mampu menangani kasus penggunaan utama kami dengan cepat dan sederhana menjadikan CloudWatch sebagai solusi pilihan.“

Joshua Barratt, Arsitek II (Architect II) - SendGrid

Pelajari observabilitas langsung

Lihat Lokakarya One Observability yang interaktif dan menarik, serta lakukan praktik langsung menggunakan Amazon CloudWatch dan AWS X-Ray. Dalam lokakarya ini, Anda akan men-deploy aplikasi layanan mikro yang kompleks serta menyiapkan pemantauan dan pengamatan dalam lingkungan modern. Anda akan mendapatkan pemahaman yang jelas mengenai pembuatan log, metrik, pemantauan kontainer dan serverless, serta teknik pelacakan.

Mulai lokakarya 
Apa yang Baru
Tanggal (Terbaru ke Terlama)
  • Tanggal (Terbaru ke Terlama)
1
Hasil tidak ditemukan.
Blog
Tanggal
  • Tanggal
1
Tidak ditemukan blog yang sesuai dengan kriteria tersebut.

Temukan berbagai kasus penggunaan lainnya untuk mengelola dan mengatur di AWS

Penyediaan dan penyesuaian »

Bangun, sediakan, dan bagikan sumber daya

Konfigurasi, kepatuhan, dan audit »

Audit dan perbaiki konfigurasi sumber daya Anda

Manajemen pengoperasian terpusat »

Kelola pengoperasian cloud Anda

Tata kelola dan kontrol perusahaan »

Buat lingkungan AWS multiakun yang aman dan dikelola secara terpusat