Chuyển đến nội dung chính

Thư viện dành cho người xây dựng của Amazon

David Yanacek, Kỹ sư chính cấp cao

David Yanacek là Kỹ sư trưởng cấp cao phụ trách các dịch vụ như CloudWatch trong bộ phận Giám sát và Theo dõi Amazon tại AWS. David làm việc tại vị trí nhà phát triển phần mềm ở Amazon từ năm 2006, trước đó ông từng làm về Amazon DynamoDB, AWS Lambda, và AWS IoT. Ông cũng làm về khung dịch vụ web nội bộ và các hệ thống tự động hóa hoạt động của nhóm. Một trong những hoạt động yêu thích của David tại nơi làm việc là thực hiện phân tích nhật ký và sàng lọc các số liệu hoạt động để tìm cách làm cho hệ thống vận hành ngày càng trơn tru hơn.

Twitter LinkedIn github

A portrait photo of a smiling person wearing glasses and a collared shirt, outdoors with a blurred background.

Tác giả: David

Cách tiếp cận giám sát dịch vụ sản xuất của Amazon
Phiên thảo luận này đề cập đến toàn bộ phạm vi giám sát tại Amazon, từ cách các đội ngũ đánh giá tình trạng hệ thống ở mức cao đến cách họ tìm hiểu sâu hơn để hiểu chi tiết của một yêu cầu duy nhất. Ngoài ra, hãy tìm hiểu tư duy của Amazon về phân vị, kích thước của các chỉ số, bảng thông tin, phân tích bản ghi và theo dõi phân tán.

Hoạt động xuất sắc tại Amazon
Trong phiên này, hãy tìm hiểu về các phương pháp hoạt động của Amazon. Các thói quen mà các nhóm đã áp dụng, chẳng hạn như xử lý hồi tưởng, chia sẻ kiến thức và thường xuyên xem xét các số liệu hoạt động, đã khiến các nhóm đổi mới để xây dựng các công cụ tốt hơn và thực hiện các thay đổi kiến trúc.

Xây dựng và vận hành các hệ thống không máy chủ linh hoạt trên quy mô lớn
Trong video này, chúng tôi đề cập đến những điều AWS thực hiện để xây dựng các dịch vụ đáng tin cậy và linh hoạt, bao gồm tránh các chế độ và tình trạng quá tải, thực hiện công việc bị giới hạn, tiết lưu ở nhiều lớp, bảo vệ tính đồng thời, gửi yêu cầu lũy đẳng, áp dụng áp chế ngược và tính công bằng trong hàng đợi và thực hiện phân mảnh xáo trộn.

Thực hiện kiểm tra sức khỏe
Tự động phát hiện và giảm thiểu sự cố máy chủ mà không có hậu quả ngoài ý muốn do lỗi giả trên toàn bộ nhóm.

Thiết bị đo các hệ thống phân tán để có khả năng hiển thị hoạt động
Hiểu rõ hoạt động vận hành trong hệ thống sản xuất và khắc phục sự cố bằng công cụ đo lường phần mềm.

Sử dụng giảm tải để tránh quá tải
Các chiến lược giúp duy trì hiệu năng ổn định, có thể dự báo khi đối mặt với tình trạng quá tải.

Sử dụng cách ly phụ thuộc để ngăn chặn tình trạng quá tải đồng thời
Chứa tác động gây ra bởi sự phụ thuộc không thành công để chỉ ảnh hưởng đến chức năng có liên quan trong một ứng dụng. 

Công bằng trong các hệ thống nhiều người thuê
Xây dựng sự công bằng trong các hệ thống đa người thuê để cung cấp hiệu suất và tính khả dụng có thể dự đoán được.

Tránh tình trạng tồn đọng hàng đợi không thể vượt qua
Ưu tiên rút hết khối lượng công việc quan trọng khỏi hàng đợi tồn đọng một cách nhanh chóng và tránh tồn đọng ngay từ đầu.