David Yanacek
David Yanacek, Kỹ sư chính cấp cao
David Yanacek là Kỹ sư trưởng cấp cao phụ trách các dịch vụ như CloudWatch trong bộ phận Giám sát và Theo dõi Amazon tại AWS. David làm việc tại vị trí nhà phát triển phần mềm ở Amazon từ năm 2006, trước đó ông từng làm về Amazon DynamoDB, AWS Lambda, và AWS IoT. Ông cũng làm về khung dịch vụ web nội bộ và các hệ thống tự động hóa hoạt động của nhóm. Một trong những hoạt động yêu thích của David tại nơi làm việc là thực hiện phân tích bản ghi và sàng lọc các số liệu hoạt động để tìm cách làm cho hệ thống vận hành ngày càng trơn tru hơn.
Tác giả: David
Cách tiếp cận giám sát dịch vụ sản xuất của Amazon
Phiên thảo luận này đề cập đến toàn bộ phạm vi giám sát tại Amazon, từ cách các đội ngũ đánh giá tình trạng hệ thống ở mức cao đến cách họ tìm hiểu sâu hơn để hiểu chi tiết của một yêu cầu duy nhất. Ngoài ra, hãy tìm hiểu tư duy của Amazon về phân vị, kích thước của các chỉ số, bảng thông tin, phân tích bản ghi và theo dõi phân tán.
Xuất sắc trong vận hành tại Amazon
Trong phiên này, hãy tìm hiểu về các phương pháp vận hành của Amazon. Cách các thói quen mà các nhóm đã áp dụng, chẳng hạn như thực hiện hồi cứu, chia sẻ kiến thức và thường xuyên xem xét các chỉ số vận hành, đã giúp các nhóm đổi mới để xây dựng công cụ tốt hơn và tạo ra những thay đổi về kiến trúc.
Xây dựng và vận hành các hệ thống phi máy chủ linh hoạt trên quy mô lớn
Trong video này, chúng tôi đề cập đến những điều AWS thực hiện để xây dựng các dịch vụ đáng tin cậy và linh hoạt, bao gồm tránh các chế độ và tình trạng quá tải, thực hiện công việc bị giới hạn, tiết lưu ở nhiều lớp, bảo vệ tính đồng thời, gửi yêu cầu lũy đẳng, áp dụng áp chế ngược và tính công bằng trong hàng đợi và thực hiện phân mảnh xáo trộn.
Tiến hành kiểm tra tình trạng
Tự động phát hiện và giảm thiểu sự cố máy chủ mà không có hậu quả ngoài ý muốn do lỗi giả trên toàn bộ nhóm.
Đo lường hệ thống phân tán để tăng khả năng hiển thị vận hành
Hiểu rõ hoạt động vận hành trong hệ thống sản xuất và khắc phục sự cố bằng mã đo lường phần mềm.
Sử dụng biện pháp giảm tải để tránh quá tải
Các chiến lược giúp duy trì hiệu năng ổn định, có thể dự báo khi đối mặt với tình trạng quá tải.
Sử dụng cách ly quan hệ phụ thuộc để khoanh vùng tình trạng quá tải đồng thời
Khoanh vùng tác động do một phần quan hệ phụ thuộc bị lỗi gây ra để chỉ ảnh hưởng đến chức năng liên quan trong ứng dụng.
Công bằng trong các hệ thống nhiều đối tượng thuê
Xây dựng sự công bằng trong các hệ thống nhiều đối tượng thuê để cung cấp hiệu năng và độ sẵn sàng có thể dự đoán được.
Tránh tồn đọng hàng đợi không khắc phục được
Ưu tiên rút hết khối lượng công việc quan trọng khỏi hàng đợi tồn đọng một cách nhanh chóng và tránh tồn đọng ngay từ đầu.