Chuyển đến nội dung chính

Amazon S3

Siêu dữ liệu Amazon S3

Tăng tốc độ khám phá dữ liệu với siêu dữ liệu đối tượng gần theo thời gian thực

Tìm và sắp xếp dữ liệu bạn cần trong Amazon S3

Siêu dữ liệu Amazon S3 khai phá trọn tiềm năng của dữ liệu Amazon S3 khi cho phép người dùng truy cập và truy vấn siêu dữ liệu đối tượng một cách dễ dàng hơn. Hiển thị, lưu trữ và truy vấn kho siêu dữ liệu đa dạng cho tất cả các đối tượng được lưu trữ trong Amazon S3 giúp bạn nhanh chóng tìm thấy dữ liệu cần thiết cho phân tích kinh doanh, ứng dụng suy luận thời gian thực các mục đích khác. Siêu dữ liệu S3 hỗ trợ siêu dữ liệu của đối tượng, bao gồm các chi tiết do hệ thống xác định như kích cỡ và nguồn của đối tượng cũng như siêu dữ liệu tùy chỉnh, cho phép bạn sử dụng thẻ để chú thích đối tượng với thông tin như SKU sản phẩm, ID giao dịch hoặc xếp hạng nội dung. Siêu dữ liệu S3 tự động điền siêu dữ liệu cho cả đối tượng mới và hiện có, cung cấp cho bạn cái nhìn toàn diện, có thể truy vấn về dữ liệu của bạn. Đọc  blog để tìm hiểu thêm.

Lợi ích

Được thiết kế để tạo và quản lý siêu dữ liệu cho tất cả các đối tượng trong vùng lưu trữ S3 của bạn - cả đối tượng hiện có và tải lên mới - cung cấp một cái nhìn toàn diện về dữ liệu của bạn.

Nhanh chóng tìm và truy xuất dữ liệu bạn cần trên hàng nghìn tỷ đối tượng trong Amazon S3. Chúng tôi cập nhật siêu dữ liệu hàng giờ để bạn có thể dễ dàng hiểu được toàn cảnh lưu trữ mới nhất của mình.

Sử dụng thẻ đối tượng để chú thích đối tượng của bạn với siêu dữ liệu dành riêng cho doanh nghiệp để cải thiện tổ chức dữ liệu và khả năng tìm kiếm.

Truy cập siêu dữ liệu của bạn thông qua các bảng kiểm kê trực tiếp và bảng nhật ký trong các Bảng S3 được quản lý, với hỗ trợ tích hợp sẵn cho Apache Iceberg.

Phân tích siêu dữ liệu bằng các dịch vụ AWS quen thuộc như Amazon Athena, Redshift và EMR thông qua tích hợp Bảng S3 với Lakehouse của Amazon SageMaker. Siêu dữ liệu S3 tương thích với các công cụ mã nguồn mở phổ biến.

Trường hợp sử dụng

Sử dụng siêu dữ liệu phong phú để lập danh mục tất cả dữ liệu để khám phá và sử dụng dễ dàng hơn. Có một cái nhìn đầy đủ về tất cả các đối tượng trong bộ chứa S3 của bạn để theo dõi và hiểu được lưu trữ dữ liệu của bạn.

Theo dõi và quản lý các video do AI tạo, bao gồm nguồn gốc, thời gian tạo và mô hình AI được sử dụng với Amazon Bedrock.

Phân tích siêu dữ liệu đối tượng trên toàn bộ hệ thống lưu trữ của bạn để xác định các cơ hội tiết kiệm chi phí và cải thiện hiệu suất.

Nhanh chóng xác định và phân tích các bộ dữ liệu có liên quan cho trí tuệ kinh doanh và ra quyết định.

Cải thiện tổ chức dữ liệu và tuân thủ với chú thích siêu dữ liệu tùy chỉnh.

Khách hàng

Hệ thống viễn thông di động Cambridge

Cambridge Mobile Telematics (CMT) là nhà cung cấp dịch vụ viễn thông lớn nhất thế giới. Sứ mệnh của CMT là tăng cường an toàn cho đường xá và tài xế trên toàn thế giới. DriveWell Fusion®, nền tảng điều khiển AI của công ty, thu thập dữ liệu cảm biến từ hàng triệu thiết bị IoT - bao gồm điện thoại thông minh, Thẻ độc quyền, xe được kết nối, camera hành trình và thiết bị của bên thứ ba - và kết hợp chúng với dữ liệu theo ngữ cảnh để tạo ra một cái nhìn thống nhất về hành vi của xe và người lái.

“Tại CMT, chúng tôi lưu trữ và phân tích nhiều petabyte dữ liệu từ các thiết bị IoT di động trên toàn thế giới để tăng cường an toàn cho người lái xe và đường bộ. Khi chúng tôi mở rộng quy mô, ngày càng khó xác định vị trí dữ liệu cụ thể để phát triển những mô hình và thông tin chuyên sâu mới. Siêu dữ liệu S3, đặc biệt là khả năng siêu dữ liệu tùy chỉnh của nó, cho phép chúng tôi chú thích tất cả dữ liệu của mình và duy trì siêu dữ liệu trong một bảng được quản lý, có thể truy vấn. Giờ đây, chỉ cần một truy vấn SQL hiệu quả và tiết kiệm chi phí là có thể tìm kiếm dữ liệu có liên quan. Điều này làm cho S3 Metadata trở thành một yếu tố thay đổi cuộc chơi, cho phép chúng tôi mang đến những khả năng mới cho khách hàng của mình. “

Tim Vogel, Giám đốc thông tin – Cambridge Mobile Telematics

Missing alt text value

PayPal

PayPal đã cách mạng hóa thương mại trên toàn cầu trong hơn 25 năm. Tạo ra những trải nghiệm sáng tạo giúp việc chuyển tiền, bán hàng và mua sắm trở nên đơn giản, được cá nhân hóa và an toàn, PayPal trao quyền cho người tiêu dùng và doanh nghiệp tại khoảng 200 thị trường để tham gia và phát triển mạnh trong nền kinh tế toàn cầu.

“S3 Metadata cung cấp cho chúng tôi một cơ chế đơn giản, dễ hiểu để phân tích hàng nghìn tỷ đối tượng S3 bằng cách sử dụng các công cụ tiêu chuẩn như Amazon Athena và Amazon QuickSight. Với chức năng này, chúng ta có thể dành thời gian đưa ra quyết định thay vì xây dựng các đường ống dữ liệu phức tạp của mình để truy cập và truy vấn siêu dữ liệu đối tượng S3. “

Jon Southall, Phó giám đốc Kỹ thuật, Nền tảng doanh nghiệp lớn – PayPal

Missing alt text value

Roche

Roche là một công ty công nghệ sinh học kết hợp dược phẩm và chẩn đoán hướng tới mục tiêu đạt được những tiến bộ trong chăm sóc sức khỏe cá nhân hóa và cải thiện cuộc sống của mọi người.

“Siêu dữ liệu S3 tăng tốc các sáng kiến AI tổng hợp của chúng tôi. Khi chúng tôi xây dựng các ứng dụng LLM như chatbot nội bộ cho các nhóm của mình, dữ liệu phi cấu trúc như PDF ngày càng trở nên có giá trị. Chúng tôi cần nhập rất nhiều tài liệu dành riêng cho tên miền vào ứng dụng Kỹ thuật tạo sinh tăng cường truy xuất (RAG) để chatbot có thể điều chỉnh cho phù hợp với bối cảnh kinh doanh cụ thể của Roche. Tuy nhiên, điều này cũng đồng nghĩa chúng tôi ngày càng có nhiều dữ liệu phi cấu trúc cần quản lý. Chúng tôi cần một hệ thống siêu dữ liệu để mô tả hiệu quả dữ liệu phi cấu trúc để người dùng có thể nhanh chóng sàng lọc qua hồ dữ liệu lớn của chúng tôi, từ đó xác định các bộ dữ liệu có liên quan cho ứng dụng AI tạo sinh cụ thể mà họ đang xây dựng. Với Siêu dữ liệu S3, việc xây dựng một hệ thống siêu dữ liệu mạnh mẽ đã được đơn giản hóa chỉ bằng vài cú nhấp chuột trong Bảng điều khiển quản lý AWS. Khi chúng tôi liên tục nhập nhiều dữ liệu phi cấu trúc hơn, Siêu dữ liệu S3 sẽ tự động hiển thị siêu dữ liệu và duy trì cập nhật siêu dữ liệu. Chúng tôi cũng sử dụng Lambda của riêng mình để trích xuất siêu dữ liệu dành riêng cho doanh nghiệp, chẳng hạn như phân loại tài liệu dựa trên phân loại có liên quan đến Roche và lưu trữ siêu dữ liệu này trong cùng một danh mục glue cùng với bảng Siêu dữ liệu S3 để chúng tôi có thể có tất cả siêu dữ liệu cần thiết chỉ với một liên kết SQL đơn giản. S3 Metadata giúp chúng tôi xây dựng các ứng dụng AI tạo ra nhanh hơn, cho phép chúng tôi tập trung vào việc xây dựng hơn là sắp xếp dữ liệu của mình. “

Yannick Misteli, Giám đốc kỹ thuật thương mại dược phẩm – Roche

The Roche logo in blue text inside a blue hexagon outline on a transparent background.

SmugMug/Flickr

SmugMug và Flickr cung cấp các nền tảng trực tuyến nơi các nhiếp ảnh gia có thể tải lên và chia sẻ ảnh và video. Công ty lưu trữ hàng tỷ hình ảnh và video trên ứng dụng của mình.

Hãy tưởng tượng bay một cỗ máy thời gian qua dữ liệu Amazon S3 của bạn. Tại SmugMug và Flickr, chúng tôi đã lưu trữ hơn 22 năm ảnh của khách hàng, hàng trăm tỷ đối tượng, trong S3. Tính năng Siêu dữ liệu S3 mới giúp chúng tôi dễ dàng khám phá siêu dữ liệu đối tượng S3 của mình một cách dễ dàng với mức giá phải chăng, truy vấn trên siêu dữ liệu như kích thước đối tượng theo thời gian để hiểu dữ liệu của chúng tôi đã phát triển như thế nào, trước đây liên quan đến việc kết hợp các truy vấn cơ sở dữ liệu đắt tiền với kho đối tượng. Hiểu được cách các nhiếp ảnh gia sử dụng bộ nhớ của chúng tôi sẽ giúp chúng tôi tiếp tục cam kết xây dựng một thế giới tốt đẹp hơn thông qua sức mạnh của nhiếp ảnh. “

Andrew Shieh, Kỹ sư trưởng – SmugMug

Missing alt text value

Tăng tốc độ khám phá dữ liệu với siêu dữ liệu đối tượng

Siêu dữ liệu Amazon S3 tự động tạo siêu dữ liệu phong phú cho các đối tượng S3 của bạn gần theo thời gian thực. Hãy quan sát chúng tôi khám phá và truy vấn các đối tượng dựa trên siêu dữ liệu tùy chỉnh bằng cách sử dụng thẻ đối tượng. Cho dù bạn đang quản lý các hồ dữ liệu trên quy mô lớn hay tối ưu hóa hoạt động khám phá dữ liệu, bạn sẽ nhận được những thông tin chuyên sâu thực tế về quản lý dữ liệu dựa trên siêu dữ liệu.