Các tính năng của Amazon CloudWatch

Tổng quan

Amazon CloudWatch là dịch vụ giám sát và quản lý, cung cấp dữ liệu và thông tin chuyên sâu hữu ích cho các tài nguyên cơ sở hạ tầng cũng như ứng dụng AWS, ứng dụng tại chỗ, ứng dụng kết hợp và các ứng dụng đám mây khác. Bạn có thể thu thập và tiếp cận tất cả dữ liệu về hiệu năng và hoạt động dưới hình thức bản ghi và số liệu trong cùng một nền tảng, thay vì theo dõi trong các silo (máy chủ, mạng hoặc cơ sở dữ liệu). CloudWatch cho phép bạn theo dõi toàn diện (ứng dụng, cơ sở hạ tầng, mạng và dịch vụ) và sử dụng cảnh báo, bản ghi và dữ liệu sự kiện để tự động hành động và giảm thời gian xử lý trung bình (MTTR). Dịch vụ này giúp bạn giải phóng tài nguyên và tập trung vào việc xây dựng các ứng dụng và giá trị doanh nghiệp.

CloudWatch cung cấp thông tin định hướng hành động, hỗ trợ việc tối ưu hóa hiệu năng ứng dụng, quản lý sử dụng tài nguyên và hiểu rõ tình trạng hoạt động của toàn hệ thống. CloudWatch hiển thị dữ liệu số liệu và nhật ký chi tiết đến từng giây, duy trì dữ liệu trong 15 tháng (số liệu) và cho phép tính toán trên số liệu. Dịch vụ này cũng giúp bạn thực hiện phân tích lịch sử nhằm tối ưu hóa chi phí và thu thập thông tin góp phần tối ưu hóa ứng dụng và tài nguyên cơ sở hạ tầng. Bạn có thể sử dụng Thông tin chuyên sâu về bộ chứa của CloudWatch để giám sát, khắc phục sự cố cũng như cảnh báo ứng dụng và vi dịch vụ có trong bộ chứa của mình. CloudWatch thu thập, tổng hợp và tóm tắt thông tin sử dụng điện toán (như CPU, bộ nhớ, ổ đĩa và dữ liệu mạng) cũng như thông tin chẩn đoán (như lỗi khi khởi động lại bộ chứa) nhằm giúp kỹ sư DevOps cô lập và giải quyết sự cố một cách nhanh chóng. Thông tin chuyên sâu về bộ chứa cung cấp cho bạn thông tin chi tiết từ các dịch vụ quản lý bộ chứa như Amazon ECS dành cho Kubernetes (EKS), Dịch vụ bộ chứa linh hoạt Amazon (ECS), AWS Fargate và Kubernetes (k8s) độc lập. 

Tổng hợp

Dịch vụ Amazon CloudWatch Logs cho phép bạn tổng hợp và lưu trữ nhật ký từ tài nguyên, ứng dụng và dịch vụ gần như theo thời gian thực. Có ba nhóm nhật ký chính:

1) Nhật ký có tính phí. Đây là các nhật ký do chính dịch vụ AWS trích xuất thay bạn. Hiện tại, chúng tôi hỗ trợ hai loại nhật ký từ Amazon VPC Flow Logs và Amazon Route 53.

2) Nhật ký do các dịch vụ AWS trích xuất. Hiện có hơn 30 dịch vụ AWS trích xuất nhật ký lên CloudWatch. Các dịch vụ này bao gồm Cổng API Amazon, AWS Lambda, AWS CloudTrail và nhiều dịch vụ khác.

3) Bản ghi tùy chỉnh. Là các bản ghi từ ứng dụng và tài nguyên tại chỗ của bạn, cũng như từ các đám mây khác.

Bạn có thể sử dụng AWS Systems Manager để cài đặt CloudWatch Agent hoặc sử dụng hành động PutLogData API để dễ dàng trích xuất nhật ký.

Amazon CloudWatch cho phép bạn thu thập số liệu về cơ sở hạ tầng từ hơn 70 dịch vụ AWS, như Amazon Elastic Compute Cloud (Amazon EC2), Amazon DynamoDB, Amazon Simple Storage Service (Amazon S3), Amazon ECS, AWS Lambda và Amazon API Gateway theo cách hoàn toàn tự động. Ví dụ: các phiên bản Amazon EC2 tự động trích xuất số liệu về việc sử dụng CPU, truyền dữ liệu và sử dụng ổ đĩa giúp bạn nắm rõ hơn về các thay đổi trạng thái. Bạn có thể sử dụng số liệu tích hợp dành cho API Gateway để phát hiện độ trễ hoặc sử dụng số liệu tích hợp dành cho AWS Lambda để phát hiện lỗi hoặc nghẽn dữ liệu. Tương tự, Amazon CloudWatch cũng cho phép thu thập các số liệu ứng dụng (như hoạt động người dùng, số liệu về lỗi và bộ nhớ đã dùng) từ ứng dụng riêng của bạn để giám sát hiệu năng hoạt động, khắc phục sự cố và phát hiện xu hướng. Bạn có thể sử dụng CloudWatch Agent hoặc lệnh gọi dịch vụ trong API PutMetricData để trích xuất các số liệu này lên CloudWatch. Nếu cần số liệu chi tiết hơn ngoài các số liệu cơ sở hạ tầng mặc định chẳng hạn, như số liệu phân đoạn dữ liệu Amazon Kinesis Data Streams, bạn chỉ cần lựa chọn trên mỗi tài nguyên. Tương tự, các số liệu ứng dụng được hỗ trợ với tần suất lên đến một giây và có thể sử dụng trong thống kê, biểu đồ cũng như cảnh báo với độ phân giải cao.

Container Insights giúp đơn giản hóa việc thu thập và tổng hợp các số liệu chọn lọc và nhật ký hệ sinh thái container. Đây là dịch vụ chuyên thu thập số liệu về hiệu năng điện toán như thông tin CPU, bộ nhớ, mạng và ổ đĩa trong từng bộ chứa dưới dạng sự kiện hiệu năng và tự động tạo số liệu tùy chỉnh dùng để theo dõi và cảnh báo. Các sự kiện hiệu năng sẽ được thu nạp dưới dạng CloudWatch Logs kèm theo siêu dữ liệu về môi trường hoạt động, như ID phiên bản Amazon EC2, Dịch vụ và ID và ổ đĩa gắn Amazon Elastic Block Store (Amazon EBS) để đơn giản hóa công tác theo dõi và khắc phục sự cố. Số liệu tùy chỉnh của CloudWatch được trích xuất tự động từ các nhật ký được thu nạp này và có thể phân tích sâu hơn bằng ngôn ngữ truy vấn nâng cao của CloudWatch Logs Insights. Container Insights cũng đem đến tùy chọn thu thập nhật ký ứng dụng (stdout/stderr), nhật ký tùy chỉnh, nhật ký phiên bản Amazon EC2 định sẵn, nhật ký mặt phẳng dữ liệu của Amazon EKS/k8s và nhật ký mặt phẳng điều khiển của Amazon EKS. Đối với các cụm Amazon EKS và k8s, có thể sử dụng tác tử FluentD cấu hình trước để thu thập nhật ký của bạn. Hãy tham khảo tài liệu về thiết lập nhật ký trong Container Insights để biết thêm thông tin chi tiết. Đối với Amazon ECS, bạn có thể sử dụng trình điều khiển tạo bản ghi của Bản ghi Amazon CloudWatch hoặc Fluent Bit để thu thập các bản ghi ứng dụng.

Thông tin chuyên sâu về Lambda trên CloudWatch Lambda giúp đơn giản hóa việc thu thập cũng như tổng hợp bản ghi và chỉ số chọn lọc từ các hàm AWS Lambda. Đây là dịch vụ chuyên thu thập số liệu hiệu năng điện toán như thông tin CPU, bộ nhớ và mạng từ mỗi hàm Lambda dưới dạng sự kiện hiệu năng, đồng thời tự động tạo số liệu tùy chỉnh được sử dụng để giám sát và cảnh báo. Sự kiện hiệu năng được thu nạp dưới dạng nhật ký CloudWatch để đơn giản hóa việc giám sát và khắc phục sự cố. Số liệu tùy chỉnh của CloudWatch được trích xuất tự động từ các nhật ký được thu nạp này và có thể phân tích sâu hơn bằng ngôn ngữ truy vấn nâng cao của CloudWatch Logs Insights. Xem tài liệu hướng dẫn bắt đầu dùng Lambda Insights để biết thêm thông tin chi tiết.

Amazon CloudWatch Metric Streams cho phép bạn tạo các luồng số liệu liên tục, gần như theo thời gian thực đến một đích tùy chọn. Dịch vụ này giúp bạn dễ dàng gửi số liệu CloudWatch đến các nhà cung cấp dịch vụ bên thứ ba phổ biến thông qua điểm cuối HTTP Amazon Kinesis Data Firehose. Bạn có thể tạo một luồng liên tục, có khả năng mở rộng chứa các số liệu CloudWatch cập nhật nhất để cải thiện bảng thông tin, chuông báo và các công cụ khác hoạt động dựa trên số liệu chính xác và kịp thời. Dễ dàng hướng số liệu đến hồ dữ liệu của bạn trên AWS (chẳng hạn như trên Amazon S3) và bắt đầu phân tích mức sử dụng hoặc hiệu năng bằng các công cụ như Amazon Athena.

Giám sát

Bạn có thể sử dụng khả năng quan sát liên tài khoản trong CloudWatch để quan sát tài nguyên trong nhiều tài khoản AWS. Đầu tiên, xác định các tài khoản có tài nguyên cần được giám sát bằng cách chỉ định chúng là tài khoản nguồn. CloudWatch bắt đầu thu thập các chỉ số, bản ghi và dấu vết cho các tài nguyên bên trong tài khoản nguồn và chia sẻ dữ liệu với tài khoản giám sát, đây là tài khoản AWS trung tâm mà bạn chỉ định để xem và tương tác với dữ liệu khả năng quan sát được tạo từ tài khoản nguồn. Dữ liệu bản ghi và chỉ số được thu thập và chia sẻ với các tài khoản giám sát mà không tính thêm phí. Đối với dữ liệu dấu vết, CloudWatch cung cấp bản sao dấu vết đầu tiên đến tài khoản giám sát đầu tiên mà không tính thêm phí. Nếu bạn chọn gửi bản sao dấu vết đến thêm tài khoản giám sát khác để có chế độ xem tổng hợp giữa các tài khoản thì tài khoản nguồn của bạn sẽ bị tính phí dựa trên giá AWS X-Ray và Amazon CloudWatch tiêu chuẩn. Bản sao dấu vết có thể được gửi từ từng tài khoản nguồn đến tối đa năm tài khoản giám sát

Bảng thông tin Amazon CloudWatch cho phép tạo biểu đồ có thể tái sử dụng và trực quan hóa tài nguyên đám mây cũng như các ứng dụng trong một chế độ xem hợp nhất. Bạn có thể tạo biểu đồ số liệu và dữ liệu nhật ký đặt cạnh nhau trong cùng một bảng thông tin để nhanh chóng nắm tình hình và chuyển từ chẩn đoán vấn đề sang hiểu rõ nguyên nhân gốc rễ. Ví dụ: bạn có thể trực quan hóa các số liệu chính, chẳng hạn như số liệu sử dụng CPU và bộ nhớ, rồi so sánh với dung lượng. Bạn cũng có thể xác định mối tương quan trong quy luật ghi nhật ký của một số liệu cụ thể và đặt cảnh báo để cảnh báo cho bạn khi có vấn đề về hiệu năng và hoạt động. Tính năng này cho phép bạn quan sát tình trạng hoạt động của toàn bộ hệ thống và có khả năng nhanh chóng khắc phục sự cố để giảm MTTR.

Với cảnh báo tổng hợp của Amazon CloudWatch, bạn có thể kết hợp nhiều cảnh báo và giảm bớt tình trạng nhiễu loạn cảnh báo. Nếu một sự cố gây ảnh hưởng tới nhiều tài nguyên trong một ứng dụng, bạn sẽ nhận được một cảnh báo duy nhất về toàn bộ ứng dụng, thay vì một thông báo cho từng tài nguyên bị ảnh hưởng. Việc này giúp bạn tập trung tìm nguyên nhân gốc của các sự cố về hoạt động để giảm thời gian dừng hoạt động của ứng dụng. Bạn có thể cung cấp trạng thái tổng thể của một nhóm các tài nguyên, chẳng hạn như ứng dụng, Khu vực AWS hoặc Vùng sẵn sàng.

Amazon CloudWatch cho phép cài đặt ngưỡng số liệu và kích hoạt một hành động. Bạn có thể tạo các cảnh báo chi tiết, cài đặt mức độ phần trăm theo dạng thống kê và chỉ định một hành động hoặc bỏ qua khi thích hợp. Ví dụ: bạn có thể tạo cảnh báo về các số liệu Amazon EC2, cài đặt thông báo và thực hiện một hoặc nhiều hành động để phát hiện và tắt các phiên bản không được sử dụng hoặc chưa được sử dụng. Cảnh báo thời gian thực với các số liệu và sự kiện cho phép giảm tối thiểu thời gian ngừng hoạt động và các tác động đến kinh doanh có thể xảy ra.

Các ứng dụng và tài nguyên cơ sở hạ tầng tạo ra một lượng lớn dữ liệu hoạt động và theo dõi dưới hình thức nhật ký và số liệu. Ngoài việc giúp bạn đánh giá và trực quan hóa các bộ dữ liệu này trong cùng một nền tảng, Amazon CloudWatch còn giúp dễ dàng xác định mối tương quan giữa chúng. Điều này giúp bạn nhanh chóng chuyển từ chẩn đoán vấn đề sang hiểu rõ nguyên nhân gốc rễ. Chẳng hạn, bạn có thể xác định mối tương quan trong một quy luật ghi nhật ký, ví dụ như lỗi ở một số liệu cụ thể, và thiết lập cảnh báo để được nhắc nhở các vấn đề về hiệu năng và hoạt động.

Amazon CloudWatch Application Insights cung cấp cách thức thiết lập tự động khả năng quan sát đối với các ứng dụng của doanh nghiệp bạn, để bạn có thể thấy được tình trạng của chúng. Tính năng này giúp bạn xác định và thiết lập các nhật ký và số liệu chính trên tài nguyên ứng dụng và tập hợp công nghệ của bạn, chẳng hạn như cơ sở dữ liệu, máy chủ web (IIS) và máy chủ ứng dụng, hệ điều hành, bộ cân bằng tải và hàng đợi. Tính năng này liên tục giám sát dữ liệu đo đạc từ xa để phát hiện và xác định mối tương quan trong các vấn đề bất thường và lỗi, từ đó thông báo cho bạn về bất kỳ sự cố nào trong ứng dụng. Để hỗ trợ khắc phục sự cố, tính năng này tạo bảng thông tin tự động cho các sự cố phát hiện được, kèm theo các vấn đề bất thường về chỉ số và lỗi nhật ký có sự tương quan, cùng với thông tin chi tiết bổ sung để cho bạn thấy nguyên nhân gốc rễ tiềm ẩn. Điều này cho phép bạn khắc phục nhanh chóng để đảm bảo rằng các ứng dụng của bạn hoạt động tốt và người dùng cuối không bị ảnh hưởng.

Thông tin chuyên sâu về bộ chứa với khả năng quan sát nâng cao cho EKS

Giờ đây, Thông tin chuyên sâu về bộ chứa sẽ cung cấp các chỉ số chi tiết tích hợp cho EKS, chẳng hạn như chỉ số về hiệu suất ở cấp độ bộ chứa, chỉ số về trạng thái Kube và chỉ số về mặt phẳng điều khiển EKS, nhờ đó bạn có thể phân tích trực quan nhiều lớp bộ chứa để dễ dàng phát hiện các sự cố như rò rỉ bộ nhớ trong từng bộ chứa. Thông tin chuyên sâu về bộ chứa giờ đây cũng hiển thị danh sách các lớp bộ chứa tiêu tốn nhiều tài nguyên, nên bạn có thể xác định các rủi ro trong môi trường của mình, kể cả nếu chưa thiết lập cảnh báo, từ đó chủ động đưa ra hành động trước khi trải nghiệm của người dùng cuối bị ảnh hưởng. Thông tin chuyên sâu về bộ chứa với khả năng quan sát nâng cao cho Amazon EKS mang đến trải nghiệm giúp bạn dễ dàng bắt đầu sử dụng, khi mà bạn có thể tự động thiết kế các cụm của mình bằng tiện ích Khả năng quan sát trên CloudWatch cho EKS trong bảng điều khiển chi tiết về cụm để ngay lập tức bắt đầu tải nhập phép đo từ xa.

Thông tin chuyên sâu về bộ chứa không có khả năng quan sát nâng cao

Thông tin chuyên sâu về bộ chứa của CloudWatch thu thập, tổng hợp và tóm tắt các chỉ số và bản ghi từ các ứng dụng và vi dịch vụ nằm trong bộ chứa của bạn đang chạy trên Dịch vụ bộ chứa linh hoạt của Amazon (Amazon ECS), Dịch vụ Kubernetes linh hoạt Amazon (Amazon EKS), các nền tảng Kubernetes trên Amazon EC2 và AWS Fargate (cho cả Amazon ECS và Amazon EKS). Thông tin chuyên sâu về bộ chứa thu thập ngay các chỉ số tích hợp liên quan đến bộ chứa như chỉ số CPU, bộ nhớ, đĩa và mạng, đồng thời cung cấp thông tin chẩn đoán sâu hơn, chẳng hạn như lỗi khởi động lại bộ chứa, để giúp bạn cô lập và giải quyết các vấn đề một cách nhanh chóng. Với Thông tin chuyên sâu về bộ chứa, bạn có thể quan sát bộ chứa của mình trong các bảng thông tin tự động, qua đó dễ dàng giám sát hiệu năng và tình trạng của ứng dụng. Bạn cũng có thể đặt cảnh báo CloudWatch cho các chỉ số có trong Thông tin chuyên sâu về bộ chứa để nhận được thông báo về các điểm bất thường trước khi chúng ảnh hưởng đến hiệu năng.

 

Trình giám sát Internet cung cấp khả năng hiển thị cách những vấn đề về Internet tác động đến hiệu năng và mức độ sẵn sàng giữa các ứng dụng được lưu trữ trên AWS và người dùng cuối, giảm thời gian bạn cần để chẩn đoán những vấn đề này từ vài ngày xuống còn vài phút. Bạn có thể khám phá các số liệu đo lường cho các khung thời gian khác nhau và ở các mức độ chi tiết địa lý khác nhau, nhanh chóng trực quan hóa tác động của vấn đề và sau đó hành động để cải thiện trải nghiệm của người dùng cuối (ví dụ như bằng cách chuyển đổi sang các dịch vụ AWS khác hoặc định tuyến lại lưu lượng truy cập đến khối lượng công việc của bạn thông qua các Khu vực AWS khác). Nếu nguyên nhân của vấn đề nằm ở mạng của AWS, bạn sẽ tự động nhận được một thông báo từ Bảng điều khiển Trạng thái AWS cho bạn biết các bước AWS đang thực hiện để khắc phục vấn đề. Trình giám sát Internet cung cấp các số liệu đo lường đến các chỉ số CloudWatch và Bản ghi CloudWatch để dễ dàng hỗ trợ tích hợp thông tin trạng thái cho các khu vực địa lý và mạng cụ thể theo ứng dụng của bạn. Đồng thời, Trình giám sát Internet gửi các sự kiện trạng thái đến Amazon EventBridge để bạn có thể thiết lập thông báo. Trình giám sát Internet giám sát ứng dụng của bạn thông qua Đám mây riêng ảo (VPC) của Amazon, các bản phân phối Amazon CloudFront và thư mục Amazon WorkSpaces.

Lambda Insights cung cấp bảng thông tin tự động trong bảng điều khiển của CloudWatch. Những bảng thông tin này tóm tắt lỗi và hiệu năng điện toán. Mỗi bảng thông tin bao gồm danh sách số liệu trong khung thời gian được chọn và cho phép bạn phân tích sâu hơn theo bối cảnh (tùy thuộc vào khung thời gian và hàm được chọn) về nhật ký ứng dụng, dấu vết AWS X-Ray và sự kiện hiệu năng.

Tính năng Amazon CloudWatch Anomaly Detection áp dụng thuật toán máy học (ML) để liên tục phân tích dữ liệu chỉ số và xác định hành vi bất thường. Điều này cho phép bạn tạo cảnh báo tự động điều chỉnh ngưỡng dựa trên các quy luật chỉ số tự nhiên như thời gian trong ngày, ngày trong tuần, tính thời vụ hoặc các xu hướng hay thay đổi. Bạn cũng có thể trực quan hóa chỉ số bằng các dải phát hiện bất thường trên bảng thông tin. Điều này cho phép bạn giám sát, cô lập và khắc phục sự cố xảy ra do các thay đổi bất thường trong chỉ số của mình.

Bạn có thể dùng Amazon CloudWatch ServiceLens để trực quan hóa và phân tích tình trạng, hiệu năng cũng như độ sẵn sàng của ứng dụng ở cùng một nơi. Dịch vụ này kết hợp chỉ số và nhật ký của CloudWatch, cũng như dấu vết từ AWS X-Ray để bạn có cái nhìn toàn diện về ứng dụng và các thành phần phụ thuộc của chúng. Như vậy, bạn sẽ nhanh chóng phát hiện được điểm gây cản trở về hiệu năng, tìm ra căn nguyên của sự cố trong ứng dụng và xác định tác động đối với người dùng. CloudWatch ServiceLens giúp bạn hiểu rõ ứng dụng của mình ở ba khía cạnh chính: theo dõi cơ sở hạ tầng (dùng chỉ số và nhật ký để hiểu về tài nguyên hỗ trợ ứng dụng của bạn), theo dõi giao dịch (dùng dữ liệu theo dõi để hiểu về thành phần phụ thuộc giữa các tài nguyên) và theo dõi người dùng cuối (dùng thử nghiệm để theo dõi các điểm cuối và thông báo cho bạn khi trải nghiệm của người dùng cuối xuống cấp). CloudWatch ServiceLens cung cấp một Bản đồ dịch vụ để trực quan hóa sự liên kết về bối cảnh của tất cả tài nguyên, cùng một giao diện trực quan để bạn tìm hiểu kỹ hơn các dữ liệu theo dõi có sự tương quan.

Với Amazon CloudWatch Synthetics, bạn có thể giám sát các điểm cuối của ứng dụng dễ dàng hơn. Dịch vụ này chạy kiểm tra 24/7 trên các điểm cuối của bạn và cảnh báo cho bạn nếu chúng không hoạt động như mong đợi. Bạn có thể tùy chỉnh các hoạt động kiểm tra này để biết được tính sẵn sàng, độ trễ, giao dịch, liên kết bị lỗi hoặc hỏng, việc hoàn thành tác vụ theo từng bước, lỗi tải trang, độ trễ khi các thuộc tính trong giao diện người dùng, quy trình hướng dẫn phức tạp hoặc luồng thanh toán trong ứng dụng. Bạn cũng có thể sử dụng CloudWatch Synthetics để tách biệt các điểm cuối cần cảnh báo trong ứng dụng, rồi ánh xạ trở lại vào các sự cố trong cơ sở hạ tầng cơ bản để giảm MTTR. Với tính năng mới này, CloudWatch sẽ thu thập dữ liệu về lưu lượng truy cập trong thử nghiệm, từ đó liên tục xác minh trải nghiệm của khách hàng ngay cả khi không có lưu lượng truy cập từ phía khách hàng trong ứng dụng. Như vậy, bạn có thể phát hiện ra sự cố trước cả khách hàng. CloudWatch Synthetics hỗ trợ giám sát API REST, URL và nội dung trang web, kiểm tra để phát hiện sự thay đổi trái phép do tấn công giả mạo, chèn mã bất hợp pháp và chèn tập lệnh nguy hiểm vào trang web.

Amazon CloudWatch RUM cung cấp cho bạn khả năng quan sát hiệu năng phía máy khách của ứng dụng và giảm MTTR. Dịch vụ này cho phép bạn thu thập dữ liệu phía máy khách về hiệu năng ứng dụng web gần như trong thời gian thực để xác định và khắc phục các sự cố. CloudWatch RUM bổ sung cho dữ liệu CloudWatch Synthetics để giúp bạn quan sát tốt hơn về trải nghiệm của người dùng cuối. Bạn có thể trực quan hóa những điểm bất thường về hiệu năng và sử dụng dữ liệu khắc phục lỗi có liên quan (chẳng hạn như thông báo lỗi, dấu vết vùng nhớ và phiên người dùng) để khắc phục các vấn đề về hiệu năng (chẳng hạn như lỗi JavaScript, sự cố và độ trễ). Bạn có thể hiểu rõ phạm vi tác động đối với người dùng cuối, trong đó bao gồm số người dùng, vị trí địa lý và trình duyệt. CloudWatch RUM tổng hợp dữ liệu về hành trình của người dùng trong ứng dụng của bạn, qua đó giúp bạn xác định tính năng cần cho ra mắt và các bản sửa lỗi cần ưu tiên.

Hành động

Auto Scaling giúp bạn tự động lập kế hoạch về khả năng đáp ứng và tài nguyên. Bạn có thể cài đặt ngưỡng cảnh báo cho một số liệu chính và kích hoạt một hành động Auto Scaling. Ví dụ: bạn có thể cài đặt một quy trình công việc Tự động thay đổi quy mô để thêm hoặc xóa phiên bản EC2 dựa trên số liệu sử dụng CPU và tối ưu chi phí tài nguyên.

CloudWatch Events cung cấp cập nhật liên tục theo thời gian thực về các sự kiện hệ thống để mô tả sự thay đổi trong tài nguyên AWS. Cho phép bạn phản hồi nhanh chóng trước những thay đổi trong hoạt động và thực hiện hành động khắc phục. Bạn chỉ cần viết những quy tắc cho biết sự kiện nào đáng lưu tâm đối với ứng dụng của bạn và thực hiện các hành động tự động nào khi quy tắc ấy phù hợp với một sự kiện. Ví dụ: bạn có thể cài đặt quy tắc để gọi các hàm AWS Lambda hay thông báo chủ đề Amazon Simple Notification Service (Amazon SNS).

Đối với các cụm Amazon EKS và k8s, Thông tin chuyên sâu về bộ chứa cho phép bạn cảnh báo theo số liệu điện toán để kích hoạt chính sách tự động thay đổi quy mô trên nhóm Tự động điều chỉnh quy mô Amazon EC2 và cung cấp cho bạn khả năng dừng, chấm dứt, khởi động lại và phục hồi mọi phiên bản Amazon EC2. Đối với cụm Amazon ECS, bạn có thể sử dụng chỉ số điện toán từ tác vụ và dịch vụ của mình cho tính năng Tự động điều chỉnh quy mô dịch vụ.  

 

Phân tích

Amazon CloudWatch cho phép bạn theo dõi xu hướng và tính thời vụ của dữ liệu số liệu trong 15 tháng (lưu trữ và duy trì). Việc này giúp bạn phân tích dựa trên dữ liệu cũ để tinh chỉnh việc sử dụng tài nguyên. Với CloudWatch, bạn cũng có thể tổng hợp số liệu tình trạng chi tiết đến một giây, bao gồm cả những số liệu tùy chỉnh (chẳng hạn như số liệu phát sinh từ các ứng dụng tại chỗ của bạn). Dữ liệu chi tiết theo thời gian thực cho phép trực quan hóa tốt hơn và có khả năng phát hiện và theo dõi xu hướng để tối ưu hóa hiệu năng cũng như tình trạng hoạt động của ứng dụng.

Amazon CloudWatch Metric Math cho phép thực hiện các tính toán trên nhiều số liệu theo phân tích thời gian thực để bạn dễ dàng thu thập thông tin từ các số liệu CloudWatch đã có và hiểu rõ hơn về tình trạng hoạt động cũng như hiệu suất của cơ sở hạ tầng. Bạn có thể trực quan hóa các số liệu đã tính toán này trong Bảng điều khiển quản lý AWS, thêm vào bảng thông tin CloudWatch hoặc truy xuất bằng hành động qua API GetMetricData. Metric Math hỗ trợ các phép tính (như +, -, / và *) và những hàm toán học (như Sum, Average, Min, Max, Standard Deviation).

Amazon CloudWatch Logs Insights cho phép bạn điều khiển thông tin khả thi từ nhật ký của mình để giải quyết các vấn đề vận hành mà không cần phải cung cấp máy chủ hoặc quản lý phần mềm. Bạn có thể bắt đầu viết truy vấn ngay với tập hợp, bộ lọc và biểu thức chính quy. Ngoài ra, bạn có thể trực quan hóa dữ liệu chuỗi thời gian, đi sâu vào từng sự kiện nhật ký, cũng như xuất kết quả truy vấn đến Bảng thông tin CloudWatch. Việc này giúp bạn quan sát rõ tình hình vận hành. Chỉ bằng vài cú nhấp chuột trong Bảng điều khiển quản lý AWS, bạn có thể bắt đầu sử dụng Logs Insights để truy vấn các nhật ký được gửi tới CloudWatch. Bạn chỉ phải trả tiền cho những truy vấn bạn chạy.

Với tính năng Live Tail của Bản ghi Amazon CloudWatch, khách hàng có được khả năng tương tác chuyên sâu trên các bản ghi được thu thập của họ để nhanh chóng bắt đầu khám phá và phân tích dữ liệu trong Bản ghi Amazon CloudWatch. Live Tail cho phép khách hàng quan sát tất cả luồng dữ liệu bản ghi của họ từ bảng điều khiển trung tâm hoặc được tích hợp trong các công cụ họ sử dụng hàng ngày cho hoạt động triển khai, vận hành hoặc điều tra bảo mật. Với Live Tail, khách hàng có thể thực hiện truy vấn chuyên sâu có bối cảnh, qua đó, họ có thể dễ dàng chuyển đổi từ sử dụng chế độ xem Live Tail để phát hiện sự cố sang trải nghiệm truy vấn Thông tin chuyên sâu về bản ghi CloudWatch để tìm hiểu sâu và giải quyết sự cố. Live Tail hỗ trợ cho các tính năng phân tích hiện tại của CloudWatch nhằm giúp khách hàng giảm bớt thời gian phát hiện và giải quyết sự cố. Tính năng này loại bỏ sự phụ thuộc vào nhiều giải pháp tùy chỉnh và của bên thứ ba cho các trường hợp sử dụng ghi bản ghi chuyên biệt.

Thông tin chuyên sâu về bộ chứa đơn giản hóa việc phân tích dữ liệu quan sát được từ các chỉ số, bản ghi và dấu vết bằng cách đơn giản hóa liên kết sâu từ bảng thông tin tự động đến sự kiện hiệu năng, bản ghi ứng dụng (stdout/stderr), bản ghi tùy chỉnh, bản ghi phiên bản Amazon EC2 định sẵn, bản ghi mặt phẳng dữ liệu của Amazon EKS/k8s và bản ghi mặt phẳng điều khiển Amazon EKS chi tiết bằng cách sử dụng ngôn ngữ truy vấn nâng cao từ Thông tin chuyên sâu về bản ghi trên CloudWatch.

Lambda Insights đơn giản hóa việc phân tích dữ liệu quan sát được từ các số liệu, nhật ký và dấu vết bằng cách tinh giản liên kết sâu từ bảng thông tin tự động đến sự kiện hiệu năng, nhật ký ứng dụng và nhật ký tùy chỉnh chi tiết bằng cách sử dụng ngôn ngữ truy vấn nâng cao của CloudWatch Logs Insights.

Amazon CloudWatch nay đã bao gồm cả Contributor Insights. Đây là công cụ phân tích dữ liệu chuỗi thời gian để cung cấp thông tin về các yếu tố ảnh hưởng nhiều nhất đến hiệu suất của hệ thống. Sau khi thiết lập, Contributor Insights sẽ chạy liên tục mà không cần người dùng can thiệp thêm. Điều này giúp nhà phát triển và người vận hành nhanh chóng tách biệt, chẩn đoán và khắc phục sự cố trong một sự kiện vận hành. Contributor Insights giúp bạn hiểu được đối tượng hay yếu tố nào, chẳng hạn như một tài nguyên, tài khoản khách hàng hoặc lệnh gọi API cụ thể, đang ảnh hưởng đến hệ thống và hiệu năng của ứng dụng. Nhờ đó, bạn có thể xác định các thành phần lạ, tìm ra quy luật về lưu lượng truy cập có tác động mạnh nhất và xếp hạng các quy trình hệ thống được sử dụng nhiều nhất. Bạn có thể tạo các quy tắc Thông tin chuyên sâu về đối tượng đóng góp để đánh giá quy luật trong sự kiện ghi có cấu trúc khi chúng được gửi đến Bản ghi CloudWatch, bao gồm cả bản ghi từ các dịch vụ AWS như AWS CloudTrail, Đám mây riêng ảo của Amazon (Amazon VPC), Cổng API Amazon, cũng như mọi bản ghi tùy chỉnh mà dịch vụ hoặc máy chủ tại chỗ của bạn gửi đến, như bản ghi truy cập Apache và các đám mây khác. Thông tin chuyên sâu về đối tượng đóng góp đánh giá các sự kiện ghi này gần như trong thời gian thực rồi hiển thị báo cáo về yếu tố ảnh hưởng hàng đầu và một số yếu tố ảnh hưởng riêng biệt trong một tập dữ liệu. Yếu tố ảnh hưởng là một chỉ số tổng hợp dựa trên các tham số được hiển thị dưới dạng trường nhật ký trong CloudWatch Logs, ví dụ như account-id hoặc interface-id trong Nhật ký luồng VPC hoặc bất kỳ nhóm tham số tùy chỉnh nào khác. Bạn có thể phân loại và lọc dữ liệu của yếu tố ảnh hưởng dựa trên tiêu chí tùy chỉnh của riêng mình. Bạn cũng có thể hiển thị dữ liệu báo cáo của Contributor Insights trên bảng thông tin CloudWatch, biểu diễn dưới dạng đồ thị bên cạnh các chỉ số CloudWatch và thêm vào cảnh báo CloudWatch.

Amazon CloudWatch Metrics Insights là một công cụ truy vấn nhanh, linh hoạt, dựa trên SQL cho phép bạn xác định các xu hướng và quy luật trong hàng triệu số liệu hoạt động, gần như trong thời gian thực. Metrics Insights giúp bạn quan sát tốt hơn về cơ sở hạ tầng của mình và hiệu năng ứng dụng trên quy mô lớn với khả năng truy vấn linh hoạt và tổng hợp chỉ số nhanh chóng. Bạn có thể dùng các truy vấn Metrics Insights để tạo hình ảnh trực quan mạnh mẽ, giúp bạn chủ động theo dõi và xác định các sự cố một cách nhanh chóng, đồng thời giảm MTTR. 

Amazon CloudWatch Evidently giúp nhà phát triển ứng dụng tiến hành các thử nghiệm và xác định hậu quả không mong muốn của các tính năng mới trước khi đưa các tính năng này ra sử dụng, do đó giảm thiểu rủi ro liên quan đến việc triển khai tính năng mới. Evidently cho phép bạn xác thực hiệu quả của các tính năng mới trên toàn bộ ứng dụng trước khi phát hành, điều này giúp cho việc phát hành an toàn hơn. Khi cho ra mắt tính năng mới, bạn có thể mang các tính năng đến với lượng người dùng nhỏ, theo dõi các số liệu chính như thời gian tải hoặc tỷ lệ chuyển đổi, sau đó tăng lưu lượng truy cập. Evidently cũng cho phép bạn thử các thiết kế khác nhau, thu thập dữ liệu người dùng và đưa ra thiết kế hiệu quả nhất trong quá trình sản xuất. 

 

Tuân thủ và Bảo mật

Amazon CloudWatch được tích hợp với dịch vụ Quản lý danh tính và truy cập (IAM) trong AWS, giúp bạn có thể kiểm soát người dùng và tài nguyên nào được phép truy cập vào dữ liệu của bạn và với cách thức nào.

Amazon CloudWatch Logs cũng tuân thủ theo PCI và FedRamp. Dữ liệu được mã hóa trong khi lưu trữ và trong khi truyền. Bạn có thể sử dụng tính năng mã hóa từ Dịch vụ quản lý khóa của AWS (AWS KMS) để mã hóa các nhóm bản ghi nhằm tăng tính bảo mật và tuân thủ.

Tính năng bảo vệ dữ liệu của Bản ghi Amazon CloudWatch giúp bạn xác định các chính sách bảo vệ dữ liệu có thể khám phá và bảo vệ dữ liệu nhạy cảm khỏi bị ghi lại bởi các hệ thống và ứng dụng. Tính năng này tự động xác định và che chắn thông tin nhạy cảm trong bản ghi của bạn bằng cách sử dụng ML và so khớp mẫu dựa trên chính sách bạn xác định. Tính năng bảo vệ dữ liệu có thể giúp bạn hợp lý hóa kiến trúc bằng cách giảm tải logic bảo vệ dữ liệu khỏi ứng dụng của bạn, đồng thời giúp hỗ trợ các mục tiêu tuân thủ của bạn. Bạn có thể xác định chính sách bảo vệ dữ liệu để quét các bản ghi trong khi tải nhập để xác định lượng dữ liệu nhạy cảm trong các bản ghi đó và che chắn dữ liệu nhạy cảm phát hiện được. Cũng có thể bỏ che chắn đối với dữ liệu đã được che để các kỹ sư bảo mật xác thực thông qua các đặc quyền được nâng tầm với IAM.