Tìm và sắp xếp dữ liệu bạn cần trong Amazon S3
Siêu dữ liệu Amazon S3 khai phá trọn tiềm năng của dữ liệu Amazon Simple Storage Service (Amazon S3) khi giúp người dùng truy cập và truy vấn siêu dữ liệu đối tượng một cách dễ dàng hơn. Hiển thị, lưu trữ và truy vấn kho siêu dữ liệu đa dạng cho các đối tượng được lưu trữ trong Amazon S3 giúp bạn nhanh chóng tìm thấy dữ liệu cần thiết cho phân tích kinh doanh, ứng dụng suy luận thời gian thực các mục đích khác. Siêu dữ liệu S3 hỗ trợ siêu dữ liệu của đối tượng, bao gồm các chi tiết do hệ thống xác định như kích cỡ và nguồn của đối tượng cũng như siêu dữ liệu tùy chỉnh, cho phép bạn sử dụng thẻ để chú thích đối tượng với thông tin như SKU sản phẩm, ID giao dịch hoặc xếp hạng nội dung. Đọc blog để tìm hiểu thêm.
Lợi ích
Trường hợp sử dụng
Khách hàng
-
Cambridge Mobile Telematics
Cambridge Mobile Telematics (CMT) là nhà cung cấp dịch vụ viễn thông lớn nhất thế giới. Sứ mệnh của CMT là tăng cường an toàn cho đường xá và tài xế trên toàn thế giới. DriveWell Fusion®, nền tảng điều khiển AI của công ty, thu thập dữ liệu cảm biến từ hàng triệu thiết bị IoT - bao gồm điện thoại thông minh, Thẻ độc quyền, xe được kết nối, camera hành trình và thiết bị của bên thứ ba - và kết hợp chúng với dữ liệu theo ngữ cảnh để tạo ra một cái nhìn thống nhất về hành vi của xe và người lái.
Tại CMT, chúng tôi lưu trữ và phân tích nhiều petabyte dữ liệu từ các thiết bị IoT di động trên toàn thế giới để tăng cường an toàn đường bộ và cho người lái xe. Khi chúng tôi mở rộng quy mô, ngày càng khó xác định vị trí dữ liệu cụ thể để phát triển những mô hình và thông tin chuyên sâu mới. Siêu dữ liệu S3, đặc biệt là khả năng siêu dữ liệu tùy chỉnh của nó, cho phép chúng tôi chú thích tất cả dữ liệu của mình và duy trì siêu dữ liệu trong một bảng được quản lý, có thể truy vấn. Giờ đây, chỉ cần một truy vấn SQL hiệu quả và tiết kiệm chi phí là có thể tìm kiếm dữ liệu có liên quan. Điều này khiến Siêu dữ liệu S3 rở thành một yếu tố thay đổi cuộc chơi, cho phép chúng tôi mang đến những tính năng mới cho khách hàng.
Tim Vogel, Giám đốc thông tin – Cambridge Mobile Telematics -
PayPal
PayPal đã cách mạng hóa thương mại trên toàn cầu trong hơn 25 năm. Tạo ra những trải nghiệm sáng tạo giúp việc chuyển tiền, bán hàng và mua sắm trở nên đơn giản, được cá nhân hóa và an toàn, PayPal trao quyền cho người tiêu dùng và doanh nghiệp tại khoảng 200 thị trường để tham gia và phát triển mạnh trong nền kinh tế toàn cầu.
S3 Metadata cung cấp cho chúng ta một cơ chế đơn giản, dễ hiểu để phân tích hàng nghìn tỷ đối tượng S3 bằng cách sử dụng các công cụ tiêu chuẩn như Amazon Athena và Amazon QuickSight. Với chức năng này, chúng ta có thể dành thời gian đưa ra quyết định thay vì xây dựng các đường ống dữ liệu phức tạp để truy cập và truy vấn siêu dữ liệu đối tượng S3.
Jon Southall, Phó giám đốc Kỹ thuật, Nền tảng doanh nghiệp lớn – PayPal -
Roche
Roche là một công ty công nghệ sinh học kết hợp dược phẩm và chẩn đoán hướng tới mục tiêu đạt được những tiến bộ trong chăm sóc sức khỏe cá nhân hóa và cải thiện cuộc sống của mọi người.
Siêu dữ liệu S3 tăng tốc các sáng kiến AI tạo sinh của chúng tôi. Khi chúng tôi xây dựng các ứng dụng LLM như chatbot nội bộ cho các nhóm của mình, dữ liệu phi cấu trúc như PDF ngày càng trở nên có giá trị. Chúng tôi cần nhập rất nhiều tài liệu dành riêng cho tên miền vào ứng dụng Kỹ thuật tạo sinh tăng cường truy xuất (RAG) để chatbot có thể điều chỉnh cho phù hợp với bối cảnh kinh doanh cụ thể của Roche. Tuy nhiên, điều này cũng đồng nghĩa chúng tôi ngày càng có nhiều dữ liệu phi cấu trúc cần quản lý. Chúng tôi cần một hệ thống siêu dữ liệu để mô tả hiệu quả dữ liệu phi cấu trúc để người dùng có thể nhanh chóng sàng lọc qua hồ dữ liệu lớn của chúng tôi, từ đó xác định các bộ dữ liệu có liên quan cho ứng dụng AI tạo sinh cụ thể mà họ đang xây dựng. Với Siêu dữ liệu S3, việc xây dựng một hệ thống siêu dữ liệu mạnh mẽ đã được đơn giản hóa chỉ bằng vài cú nhấp chuột trong Bảng điều khiển quản lý AWS. Khi chúng tôi liên tục nhập nhiều dữ liệu phi cấu trúc hơn, Siêu dữ liệu S3 sẽ tự động hiển thị siêu dữ liệu và duy trì cập nhật siêu dữ liệu. Chúng tôi cũng sử dụng Lambda của riêng mình để trích xuất siêu dữ liệu dành riêng cho doanh nghiệp, chẳng hạn như phân loại tài liệu dựa trên phân loại có liên quan đến Roche và lưu trữ siêu dữ liệu này trong cùng một danh mục glue cùng với bảng Siêu dữ liệu S3 để chúng tôi có thể có tất cả siêu dữ liệu cần thiết chỉ với một liên kết SQL đơn giản. Siêu dữ liệu S3 giúp chúng tôi xây dựng các ứng dụng AI tạo sinh nhanh hơn, cho phép chúng tôi tập trung vào việc xây dựng hơn là sắp xếp dữ liệu.
Yannick Misteli, Giám đốc kỹ thuật thương mại dược phẩm – Roche -
SmugMug / Flickr
SmugMug và Flickr cung cấp các nền tảng trực tuyến nơi các nhiếp ảnh gia có thể tải lên và chia sẻ ảnh và video. Công ty lưu trữ hàng tỷ hình ảnh và video trên ứng dụng của mình.
Hãy tưởng tượng bạn đang lái một cỗ máy thời gian qua dữ liệu Amazon S3 của bạn. Tại SmugMug và Flickr, chúng tôi đã lưu trữ hơn 22 năm ảnh của khách hàng, hàng trăm tỷ đối tượng, trong S3. Tính năng Siêu dữ liệu S3 mới giúp chúng tôi dễ dàng khám phá siêu dữ liệu đối tượng S3 của mình một cách dễ dàng với mức giá phải chăng, truy vấn trên siêu dữ liệu như kích thước đối tượng theo thời gian để hiểu dữ liệu của chúng tôi đã phát triển như thế nào, trước đây liên quan đến việc kết hợp các truy vấn cơ sở dữ liệu đắt tiền với kho đối tượng. Hiểu được cách các nhiếp ảnh gia sử dụng bộ nhớ của chúng tôi sẽ giúp chúng tôi tiếp tục cam kết xây dựng một thế giới tốt đẹp hơn thông qua sức mạnh của nhiếp ảnh.
Andrew Shieh, Kỹ sư trưởng – SmugMug -
Solink
Solink cung cấp các hệ thống bảo mật video đám mây đáng tin cậy cho các doanh nghiệp thuộc mọi quy mô. Phần cứng và phần mềm của Solink giúp cung cấp khả năng hiển thị cho các nhóm CNTT, phòng ngừa tổn thất, vận hành và bảo mật tại hàng chục nghìn địa điểm ở hơn 40 quốc gia.
Solink xử lý hơn 500 triệu giờ video hàng tháng, tích hợp cảnh quay bảo mật với dữ liệu kinh doanh quan trọng từ hơn 350 nguồn. AWS hỗ trợ cơ sở hạ tầng cho chúng tôi dựa vào và Amazon S3 Metadata sẽ tiến xa hơn nữa — cung cấp thông tin chi tiết theo thời gian thực giúp nâng cao khả năng quản lý nội dung của chúng tôi, từ giám sát lưu trữ và sử dụng đến theo dõi hiệu ứng thời gian thực của các thay đổi cấu hình của khách hàng.
Martin Soukup, Giám đốc kỹ thuật – Solink -
Commvault
Commvault là tiêu chuẩn vàng trong khả năng phục hồi mạng, giúp hơn 100.000 tổ chức giữ an toàn cho dữ liệu và các doanh nghiệp có khả năng phục hồi và tiến lên phía trước. Ngày nay, Commvault cung cấp nền tảng phục hồi mạng duy nhất kết hợp bảo mật dữ liệu tốt nhất và phục hồi nhanh chóng ở quy mô doanh nghiệp trên mọi khối lượng công việc, ở bất cứ đâu - với TCO thấp nhất.
Amazon S3 đã nổi lên như một nhà cung cấp lưu trữ đám mây hàng đầu cho các loại dữ liệu khác nhau. Amazon S3 Metadata sẽ cho phép các nhà cung cấp như Commvault chủ động giúp xác định và bảo vệ thông tin nhạy cảm, đồng thời giúp tự động hóa các yếu tố như phân tầng dữ liệu và nâng cao kết quả cho khách hàng chung của chúng tôi. Siêu dữ liệu S3 tạo điều kiện tổ chức dữ liệu hiệu quả và giúp hợp lý hóa việc khám phá dữ liệu, cho phép chú thích chi tiết về các đối tượng, điều này rất quan trọng đối với khả năng phục hồi mạng trên đám mây.
Pranay Ahlawat, Giám đốc công nghệ và AI – Commvault -
New Relic
Nền tảng quan sát thông minh Relic mới cung cấp cho khách hàng phân tích hiệu suất chuyên sâu cho mọi bộ phận trong môi trường phần mềm của bạn. Khách hàng có thể dễ dàng xem và phân tích lượng lớn dữ liệu và có được thông tin chi tiết có thể thực hiện được trong thời gian thực.
Là công ty dẫn đầu về khả năng quan sát, công cụ dữ liệu của New Relic xử lý khoảng 1,3 exabyte dữ liệu Amazon S3 mỗi ngày. S3 Metadata sẽ đẩy nhanh quá trình đổi mới của chúng tôi bằng cách tự động tạo siêu dữ liệu đối tượng phong phú, từ đó đơn giản hóa việc khám phá dữ liệu cần thiết cho các nhóm của chúng tôi để chạy thử nghiệm sản phẩm và xây dựng bằng chứng về khái niệm, chẳng hạn như phát triển các số liệu mới có lợi cho khách hàng. S3 Metadata sẽ giảm thời gian xây dựng và duy trì một hệ thống siêu dữ liệu mạnh mẽ từ hàng trăm giờ xuống chỉ còn vài cú nhấp chuột trong Bảng điều khiển quản lý S3, cho phép các kỹ sư của chúng tôi tập trung vào phân tích dữ liệu hơn là tổ chức dữ liệu.
Siva Padisetty, Giám đốc Công nghệ – New Relic