Điểm khác biệt giữa khả năng quan sát và theo dõi là gì?

Trong DevOps, khả năng quan sát và theo dõi là hai quy trình riêng biệt dựa trên dữ liệu. Bạn sử dụng hai quy trình này để duy trì và quản lý thành công tình trạng và hiệu năng của kiến trúc vi dịch vụ phân tán và cơ sở hạ tầng của các kiến trúc đó. Cách thức hoạt động của các hệ thống phân tán này là trao đổi dữ liệu giữa hàng chục đến hàng trăm hoặc hàng nghìn thành phần khác nhau. 

Theo dõi là quá trình thu thập dữ liệu và tạo báo cáo về các số liệu khác nhau xác định tình trạng của hệ thống. Khả năng quan sát là một cách tiếp cận mang tính điều tra hơn. Quy trình này xem xét kỹ tương tác giữa thành phần trong hệ thống phân tán và dữ liệu đã thu thập bằng cách theo dõi để tìm ra nguyên nhân gốc rễ của các vấn đề. Quy trình này bao gồm các hoạt động như phân tích đường dẫn theo dõi, là quá trình theo đường dẫn của một yêu cầu thông qua hệ thống để xác định các lỗi tích hợp. Quy trình theo dõi thu thập dữ liệu về các thành phần riêng lẻ và khả năng quan sát xem xét toàn bộ hệ thống phân tán.

Tìm hiểu về DevOps

Cơ chế hoạt động: khả năng quan sát và theo dõi

Cả khả năng quan sát và theo dõi đều là những quy trình thiết yếu trong việc chạy các chương trình DevOps hiệu quả.

Theo dõi

Theo dõi hệ thống điện toán đã được thực hiện ngay từ khi bắt đầu chạy các hệ thống điện toán. Quá trình theo dõi thu thập dữ liệu về một hệ thống để kiểm tra xem hệ thống đó có hoạt động như dự kiến hay không. Trong đó bao gồm các báo cáo và cảnh báo về lỗi hoặc giá trị dữ liệu bất thường. 

Ví dụ: các công cụ theo dõi có thể thu thập dữ liệu nhằm mục đích đo thời gian cần thiết để triển khai một bản phát hành ứng dụng. Nếu thời gian cần thiết nằm ngoài khoảng dự kiến, các công cụ theo dõi có thể cảnh báo người dùng, cho biết có khả năng xảy ra sự cố. 

Theo dõi DevOps bao gồm toàn bộ vòng đời phát triển phần mềm (SDLC). Theo dõi hiệu năng của ứng dụng (APM) là một tập hợp con chuyên dụng của theo dõi DevOps, tập trung vào các ứng dụng đang chạy trong quá trình sản xuất. Tập hợp con này ưu tiên các số liệu áp dụng cho trải nghiệm người dùng.

Tìm hiểu về vòng đời phát triển phần mềm

Tìm hiểu về theo dõi hiệu năng của ứng dụng

Khả năng quan sát

Khả năng quan sát mang lại phạm vi và khả năng hiển thị rộng hơn cho các công cụ theo dõi thông thường, tích hợp thêm dữ liệu tình huống và trước đó, cũng như các tương tác của hệ thống. Quy trình này cho phép điều tra nguyên nhân gốc rễ của cảnh báo theo dõi, cùng khả năng điều tra các vấn đề phát sinh do tương tác giữa nhiều thành phần.

Bạn có thể sử dụng các công cụ quan sát để gỡ lỗi cho chính các hệ thống dựa trên kiến trúc ứng dụng phân tán. Bạn cũng có thể sử dụng các công cụ này để quan sát tình trạng theo thời gian thực của hệ thống tổng thể và tương tác giữa các thành phần của hệ thống. Bạn có thể sử dụng phần mềm quan sát để lập bản đồ toàn bộ hệ thống được kết nối với nhau, các phần phụ thuộc của hệ thống và các tương tác theo thời gian thực.

Điểm tương đồng giữa khả năng quan sát và theo dõi là gì?

Cả khả năng quan sát và theo dõi ban đầu đều bắt nguồn từ lĩnh vực lý thuyết điều khiển, là một lĩnh vực kỹ và toán học của hệ thống. Cả hai đều được sử dụng rộng rãi trong các môi trường điện toán và môi trường vật lý kết hợp với máy tính để duy trì tình trạng tốt và hiệu năng của hệ thống. Trong DevOps, các thuật ngữ này thường được sử dụng như nhau vì cả hai đều liên quan đến dữ liệu đo từ xa như số liệu, sự kiện, bản ghi và dấu vết.

Chỉ số

Số liệu là các kết quả đo dữ liệu hệ thống. Ví dụ: số liệu có thể là thông lượng mạng hoặc số lỗi ứng dụng trong một tuần. Theo dõi báo cáo về số liệu còn khả năng quan sát tìm cách cải thiện giá trị của số liệu đó.

Sự kiện

Sự kiện là các hành động rời rạc diễn ra trong hệ thống tại thời điểm bất kỳ. Ví dụ có thể là người dùng thay đổi mật khẩu hoặc cảnh báo cho biết đã thử mật khẩu nhiều lần. Sự kiện kích hoạt theo dõi và hỗ trợ khả năng quan sát trong điều tra sự cố.

Bản ghi

Bản ghi là các tệp được tạo bằng phần mềm, chứa thông tin về các thao tác, hoạt động và cácb sử dụng của hệ thống. Tệp nhật ký chứa bản ghi nhật ký của tất cả các quy trình, sự kiện và thông báo cùng với các dữ liệu mô tả bổ sung (chẳng hạn như dấu thời gian) để ngữ cảnh hóa thông tin này. Theo dõi tạo bản ghi được khả năng quan sát sử dụng để phân tích thêm về hệ thống.

Tìm hiểu về các tệp bản ghi

Vết

Dấu vết là đường dẫn đầy đủ của một thao tác duy nhất trên nhiều hệ thống tương quan với nhau của thao tác đó. Để truy xuất nguồn gốc phân tán đầy đủ, tín hiệu phải được phát ra từ mọi giao dịch trong kiến trúc vi dịch vụ để theo dấu. Theo dõi cho phép truy xuất nguồn gốc, đây là một chức năng quan trọng của khả năng quan sát.

So sánh khả năng quan sát và theo dõi: điểm khác biệt chính

Theo dõi là một thành phần cốt lõi quan trọng của khả năng quan sát. Việc theo dõi toàn diện tạo ra các số liệu mô tả, sự kiện, bản ghi và dấu vết đo lường những gì thiết yếu theo cách dễ nhận biết và truy xuất. Các hồ sơ trước đây được lưu trữ cùng các phép đo hiện tại để đưa ra thông tin tổng quát về hệ thống. Khi đó, khả năng quan sát có thể sử dụng kết quả do bước theo dõi tạo ra để điều tra các sự cố sâu hơn.

Theo dõi cho biết thời điểmnội dung của lỗi hệ thống còn khả năng quan sát cho biết lý docách thức. Có nhiều tín hiệu cần lập bản đồ và theo dõi để hiểu được tổng thể về trạng thái và tình trạng nội bộ của toàn bộ hệ thống. Bạn cần tất cả dữ liệu này để có thể tiến hành các cuộc điều tra hiệu quả. Phải theo dõi toàn diện và mang tính mô tả để khả năng quan sát trở nên hữu ích và hiệu quả.

Bất thường

Với hệ thống theo dõi, bạn có thể phát hiện ra bất thường hoặc hành vi khác thường trong trạng thái và hiệu năng của hệ thống. Với khả năng quan sát, bạn có thể điều tra thêm bất kỳ bất thường nào, ngay cả khi những bất thường này xảy ra do tương tác giữa hàng trăm thành phần dịch vụ.

Nguyên nhân và tác động

Theo dõi tập trung vào đo lường một hoặc nhiều giá trị nào đó để xem có ảnh hưởng đến hệ thống hay không. Mục tiêu của khả năng quan sát là tìm hiểu nguyên nhân của tác động đó. Ví dụ: khi mã mới được phát hành, theo dõi sẽ theo dấu số liệu hệ thống để xem liệu thay đổi đó có tác dụng đến thời gian tải ứng dụng hoặc thời gian truy xuất dữ liệu hay không. Trong trường hợp có tác động, khả năng quan sát sẽ điều tra lý do hoặc nguyên nhân. Quy trình này sẽ cho biết phần nào của thay đổi mã gây ra tác động đó và đề xuất cách khắc phục tác động đó.

Tương tác hệ thống

Theo dõi thường đánh giá tình trạng của một hệ thống cụ thể. Quy trình này thu thập dữ liệu về tất cả các thành phần khác nhau của hệ thống nhưng dữ liệu có thể bị cô lập và khó hiểu được mối quan hệ tương quan. Với khả năng quan sát, bạn hiểu được tổng thể về tất cả các hệ thống tương quan với nhau, qua đó hiểu được vấn đề đang xảy ra ở đâu và như thế nào.

Thời điểm nên sử dụng: khả năng quan sát hay theo dõi

Việc phát hiện lỗi hồi cứu, chẳng hạn như tìm hiểu về sự cố mất điện từ người dùng hoặc phát hiện ứng dụng đang chạy trên hệ thống mục tiêu sai, có thể dẫn đến mất thời gian, tiền bạc, danh tiếng và tài nguyên của nhà phát triển. Do đó, phải theo dõi để chủ động phát hiện lỗi. Các công cụ theo dõi đưa ra cảnh báo cho tất cả các loại sai khác mà bạn có thể xác định và khắc phục trước khi dẫn đến hậu quả lâu dài.

Một hệ thống có thể quan sát được bổ sung cho khả năng theo dõi hiện có. Hệ thống này có tính thiết yếu trong việc chạy các kiến trúc ứng dụng vi dịch vụ, đặc biệt là khi được triển khai cho cơ sở hạ tầng đám mây phân tán. Nếu chỉ tiến hành theo dõi thì gần như không thể xác định và cô lập ứng dụng hoặc dịch vụ phát sinh lỗi. Việc thu thập và theo dõi dữ liệu phù hợp kết hợp với khả năng quan sát sẽ cho phép truy xuất nguồn gốc lỗi thông qua các hệ thống phức tạp.

Tóm tắt điểm khác biệt: theo dõi và khả năng quan sát

 

Theo dõi

Khả năng quan sát

Đó là gì?

Đo lường và báo cáo về các số liệu cụ thể trong một hệ thống để đảm bảo tình trạng tốt cho hệ thống.

Thu thập số liệu, sự kiện, bản ghi và dấu vết để cho phép điều tra sâu về các mối quan ngại đối với tình trạng trên các hệ thống phân tán có kiến trúc vi dịch vụ.

Trọng tâm chính

Thu thập dữ liệu để xác định các những tác động bất thường đến hệ thống.

Điều tra nguyên nhân gốc rễ của những tác động bất thường đến hệ thống.

Các hệ thống có liên quan

Thường liên quan đến các hệ thống độc lập.

Thường liên quan đến nhiều hệ thống khác biệt.

Khả năng truy xuất nguồn gốc

Giới hạn ở các biên của hệ thống.

Khả dụng nếu tín hiệu được phát ra trên các kiến trúc hệ thống khác biệt.

Phát hiện lỗi hệ thống

Thời điểmnội dung.

Lý docách thức.

AWS có thể hỗ trợ các yêu cầu theo dõi và khả năng quan sát của bạn như thế nào?

Hoạt động trong đám mây AWS cung cấp mô hình và công cụ để có cách hoạt động an toàn và hiệu quả trên đám mây. Bạn có thể chuyển đổi tổ chức của mình, hiện đại hóa và di chuyển các ứng dụng của mình, đồng thời tăng tốc đổi mới với Amazon Web Services (AWS). 

Với khả năng quan sát và theo dõi trong các hoạt động của đám mây, bạn có thể thu thập, tìm mối tương quan, tổng hợp và phân tích phép đo từ xa. Điều này áp dụng trên mạng, cơ sở hạ tầng và ứng dụng của bạn trong các môi trường đám mây, hỗn hợp hoặc tại chỗ. Bạn có thể hiểu rõ về hành vi, hiệu năng và tình trạng của hệ thống. Với những thông tin chi tiết này, bạn có thể phát hiện, điều tra và khắc phục sự cố nhanh hơn. Khi kết hợp với trí tuệ nhân tạo (AI) và máy học (ML), bạn có thể vận dụng những thông tin chi tiết này để chủ động phản ứng, dự đoán và ngăn chặn các vấn đề.

Chẳng hạn, bạn có thể sử dụng:

  • AWS X-Ray để phân tích và gỡ lỗi các ứng dụng sản xuất và phân tán, truy xuất nguồn gốc yêu cầu của người dùng, xác định tắc nghẽn và theo dõi hiệu năng
  • Amazon CloudWatch để truy cập và phân tích dữ liệu tài nguyên và ứng dụng, cũng như đầu ra bên ngoài thông qua các công cụ trực quan hóa hiệu quả trên AWS, tại chỗ và trong các đám mây khác
  • Grafana được quản lý của Amazon để quản lý toàn phần Grafana (công cụ theo dõi phổ biến) cho mục đích truy vấn, trực quan hóa và cảnh báo về số liệu, bản ghi và dấu vết trên dữ liệu hoạt động
  • Dịch vụ được quản lý của Amazon dành cho Prometheus để quản lý toàn phần Prometheus, một công cụ theo dõi bộ chứa để duy trì và truy vấn các số liệu chuỗi thời gian từ các cụm Kubernetes tự quản lý của bộ chứa

Bắt đầu theo dõi và sử dụng khả năng quan sát trên AWS bằng cách tạo tài khoản ngay hôm nay.