Возможности Amazon S3
- Управление хранилищем и его мониторинг
3
- Статистика и аналитика хранения данных
2
- Хранилище таблиц
1
- Векторное хранилище
1
- Файловое хранилище
1
- Классы хранилищ
2
- Управление доступом и безопасность
2
- Обработка данных
1
- Запросы к данным без извлечения
1
- Передача данных
1
- Обмен данными
1
- Производительность
2
Управление хранилищем и его мониторинг
Открыть всеПлоская неиерархическая структура Amazon S3 и различные возможности управления помогают клиентам любого уровня и из любых отраслей организовать данные выгодным для бизнеса и сотрудников образом. Все объекты хранятся в бакетах S3, и их можно организовать с помощью общих имен, которые называют префиксами. Кроме того, в каждый объект можно добавить до 10 пар «ключ-значение», которые называют тегами объектов S3. Эти пары можно создавать, обновлять и удалять в любое время в течение жизненного цикла объекта. Для отслеживания объектов и связанных с ними тегов, бакетов и префиксов, можно использовать отчет Инвентаризации S3, в котором указываются объекты, хранимые в бакете S3 или имеющие определенный префикс, а также соответствующие метаданные и статус шифрования. Сервис Инвентаризации S3 можно настроить для ежедневного или еженедельного создания отчетов.
С помощью имен бакетов S3, префиксов, тегов объектов, S3 Metadata и сервиса S3 Inventory можно классифицировать данные, создавать отчеты и настраивать другие возможности S3. Сервис Пакетные операции Amazon S3 упрощает эти задачи, независимо от количества объектов, и позволяет управлять данными в Amazon S3 в любом масштабе. Используя Пакетные операции S3, вы можете копировать объекты между бакетами, заменять наборы тегов объектов, изменять элементы управления доступом и восстанавливать архивные объекты из хранилищ классов сервисов Гибкое извлечение данных Amazon S3 Glacier и Глубокий архив Amazon S3 Glacier с помощью одного запроса к API S3 или нескольких шагов в консоли S3. С помощью сервиса Пакетные операции S3 также можно применять функции AWS Lambda к объектам для запуска настраиваемой бизнес-логики, например для обработки данных или транскодирования файлов изображений. Для начала работы выберите исходный бакет и фильтры либо создайте список целевых объектов, используя отчет Инвентаризацию S3 или указав собственный список, а затем выберите требуемую операцию в меню. После выполнения запроса пакетных операций S3 вы получите оповещение и отчет обо всех изменениях. Подробные сведения о сервисе Пакетные операции S3 см. в обучающем видео.
Метаданные Amazon S3 предоставляет запрашиваемые метаданные объектов практически в реальном времени, чтобы упорядочить данные и ускорить их обнаружение. Сервис помогает собирать, идентифицировать и использовать данные S3 для бизнес-аналитики, приложений с логическим выводом в реальном времени и многого другого. Метаданные S3 предназначены для создания метаданных всех объектов, как новых, так и существующих, в бакетах S3 и управления ими. Сюда относятся определенные системой сведения, такие как размер и источник объекта, а также настраиваемые метаданные, позволяющие аннотировать объекты такими данными, как артикул продукта, идентификатор транзакции или рейтинг контента с помощью тегов. Метаданные S3 хранят эту информацию в двух таблицах Apache Iceberg: таблицах инвентаризации в реальном времени, в которых отображается весь бакет с возможностью запроса, и таблицах журналов, отслеживающих изменения в бакете.
Amazon S3 также поддерживает возможности для контроля версий данных и предотвращения случайного удаления, а также для репликации данных в пределах одного региона AWS или в другой Регион AWS. С помощью Управления версиями в S3 можно сохранять, извлекать и восстанавливать все версии объекта, хранящегося в Amazon S3, что позволяет восстанавливать систему после непреднамеренных действий пользователей и сбоев приложений. Для предотвращения случайного удаления включите для бакета S3 Удаление с использованием многофакторной аутентификации (MFA). При попытке удалить объект из бакета с включенным удалением с использованием MFA потребуются два этапа аутентификации: мандат аккаунта AWS и последовательность из действительного серийного номера, пробела и шестизначного кода с экрана принятого устройства аутентификации, такого как аппаратный ключ или ключ безопасности U2F.
С помощью Репликации Amazon S3 можно реплицировать объекты (и связанные метаданные и теги объектов) в одну или несколько целевых бакетов в пределах одного региона или нескольких регионов для снижения задержек, обеспечения соответствия требованиям, безопасности, аварийного восстановления и ряда других стандартных примеров использования. Межрегиональную репликацию в S3 (CRR) можно настроить для репликации объектов из исходного бакета S3 в один или нескольких целевых бакетов в другом Регионе. Репликация в рамках региона (SRR) в S3 позволяет реплицировать объекты между бакетами в пределах одного Региона AWS. Репликация в режиме реального времени, такая как CRR и SRR, автоматически реплицирует вновь загруженные объекты по мере их записи в бакет, в то время как Пакетная репликация S3 позволяет работать с уже существующими объектами. Пакетную репликацию S3 можно использовать для заполнения нового бакета существующими объектами, повторной попытки неудавшейся ранее репликации объектов, переноса данных между аккаунтами или добавления новых бакетов в озеро данных. Контроль времени репликации S3 Amazon (S3 RTC) закреплена в Соглашении об уровне обслуживания (SLA) и обеспечивает прозрачность данных при репликации и соответствие требованиям к репликации данных.
Чтобы получить доступ к реплицированным наборам данных в бакетах S3 в различных Регионах и аккаунтах, используйте Точки доступа S3 для нескольких регионов Amazon, чтобы создать единый глобальный адрес, который ваши приложения и клиенты будут использовать, где бы они не находились. Глобальный адрес позволяет создавать приложения для нескольких регионов с такой же простой архитектурой, как для одного региона, а затем запускать их в любой точке мира. Точки доступа Amazon S3 для нескольких регионов могут повысить производительность до 60 % при доступе к наборам данных, которые реплицируются в нескольких Регионах AWS, и аккаунтам. Точки доступа S3 для нескольких регионов на базе Международного ускорителя AWS учитывают такие факторы, как перегрузка сети и местоположение запрашивающего приложения, чтобы динамически направлять запросы по сети AWS к копии данных с наименьшей задержкой. С помощью средства резервного переключения Точек доступа S3 для нескольких регионов вы можете выполнять резервное переключение между реплицированными наборами данных в Регионах, что дает возможность за считаные минуты переносить трафик запросов данных S3 в альтернативный Регион AWS.
Вы также можете применить политику «однократная запись, многократное считывание» (WORM) с помощью Блокировки объектов Amazon S3. Возможность управления S3 блокирует удаление версий объектов в течение периода хранения, установленного клиентом. Эта возможность позволяет применять политики хранения в качестве дополнительного уровня защиты данных либо для выполнения нормативных требований. Рабочие нагрузки можно переносить из существующих систем WORM в Amazon S3, а Блокировку объекта S3 можно настроить на уровне объектов или бакетов для предотвращения удаления версий объектов до заданной даты, которую вы можете определить самостоятельно или в соответствии с нормативными требованиями. Объекты с блокировкой объектов S3 сохраняют защиту WORM даже после перемещения в другие классы хранилища с политикой Жизненного цикла Amazon S3. Для отслеживания объектов с Блокировкой S3 можно использовать отчет Инвентаризации S3, содержащий сведения о статусе WORM объектов. S3 Object Lock можно настроить в одном из двух режимов. При использовании в режиме Governance аккаунты AWS с определенными разрешениями IAM могут снимать защиту блокировку объектов S3 с объектов. Если вам требуется большая неизменяемость для выполнения законодательных требований, можно использовать режим Compliance. В режиме Compliance защиту не может снять ни один пользователь, в том числе аккаунт root.
В дополнение к этим возможностям управления, функции S3 и другие сервисы AWS можно использовать для мониторинга и контроля ресурсов S3. С помощью тегов корзин S3 можно распределять расходы в рамках нескольких подразделений бизнеса (например, центры затрат, имена приложения или владельцы), а затем использовать отчеты о распределении расходов AWS, чтобы просматривать сведения об использовании и расходах, сгруппированные по тегам корзины. Можно также использовать Amazon CloudWatch, чтобы отслеживать работоспособность ресурсов AWS и настраивать предупреждения об оплате при достижении предела предполагаемых расходов, заданного пользователем. Используйте AWS CloudTrail для отслеживания действий с корзинами и объектами и создания отчетов о них, а также для настройки оповещений о событиях S3, чтобы запускать рабочие процессы и предупреждения или вызывать функцию AWS Lambda при внесении определенных изменений в ресурсы S3. Оповещения о событиях S3 автоматически перекодируют мультимедийные файлы после завершения загрузки в Amazon S3, обрабатывают файлы данных по мере их поступления и синхронизируют объекты с другими хранилищами данных. Кроме того, новые пакеты AWS SDK автоматически вычисляют эффективные контрольные суммы на основе CRC для всех загрузок. S3 самостоятельно проверяет контрольные суммы и принимает объекты только после подтверждения сохранения целостности данных при передаче через общедоступный Интернет. Если для загрузки объекта используется версия SDK без предварительного расчета контрольных сумм, S3 вычисляет контрольную сумму всего объекта на основе CRC даже при загрузке несколькими частями. Контрольные суммы хранятся в метаданных объекта и поэтому доступны для проверки целостности данных в любое время. Можно выбрать один из десяти поддерживаемых алгоритмов (CRC64NVME, CRC32, CRC32C, SHA-1, SHA-256, MD5, XXHash64, XXHash3, XXHash128 и SHA-512) для проверки целостности данных при выгрузке и загрузке в зависимости от потребностей вашего приложения.
Статистика и аналитика хранения данных
Открыть всеС помощью Объектива хранения данных S3 пользователь может получить наглядное представление об использовании объектного хранилища, тенденциях активности в масштабах организации, а также практические рекомендации по оптимизации расходов, улучшению производительности приложений и применению передовых методов защиты данных. Объектив хранения данных Amazon S3 – это первый инструмент для аналитической обработки данных облачного хранилища, с помощью которого можно получить единое представление об использовании и активности объектного хранилища в даже тысячах аккаунтов организации, а также детальные данные для составления аналитических оценок на уровне аккаунта, бакета или даже префикса. В основу Объектива хранения данных S3 положено более 16 лет опыта помощи клиентам в оптимизации хранения данных. Благодаря этому он выполняет анализ количественных показателей в масштабах всей организации и предоставляет ситуативные рекомендации относительно снижения затрат на хранение, улучшения производительности приложений и применения передовых методов защиты данных.
Анализ класса хранилища Amazon S3 анализирует шаблоны доступа к хранилищам, благодаря чему вы сможете решить, когда переносить определенные данные в хранилище более подходящего класса. Возможность Amazon S3 позволяет изучить шаблоны доступа к данным и определить, когда нужно перевести хранилища, которые используются менее часто, в класс хранилища с меньшей стоимостью. Результат можно использовать для улучшения политик жизненного цикла S3. Аналитику классов хранилищ можно настроить таким образом, чтобы осуществлялся анализ всех объектов в корзине. Также можно настроить фильтры, благодаря которым объекты для анализа будут группироваться по общему префиксу, тэгу объекта или по обоим параметрам сразу. Подробные сведения см. на странице со статистикой и аналитикой хранения данных.
Хранилище таблиц
Открыть все
Таблицы Amazon S3 — это первое облачное хранилище объектов со встроенной поддержкой формата открытых таблиц и самый простой способ хранения табличных данных в нужном масштабе. Таблицы S3 специально оптимизированы для аналитических рабочих нагрузок. Они обеспечивают оптимальную производительность запросов и до 10 раз больше транзакций в секунду по сравнению с таблицами Iceberg, хранящимися в бакетах S3 общего назначения. Таблицы S3 поддерживают стандарт Apache Iceberg и легко запрашиваются популярными движками запросов AWS и сторонних разработчиков. Кроме того, в Таблицах S3 предусмотрено непрерывное обслуживание таблиц для автоматической оптимизации эффективности запросов и затрат на хранение с течением времени даже в условиях масштабирования и развития озера данных.
В таблицах S3 используются бакеты таблиц — тип бакетов, специально созданный для хранения табличных данных. С помощью бакетов таблиц можно легко создавать таблицы и настраивать разрешения на уровне таблиц для управления доступом к озеру данных. После этого в таблицы можно загружать данные и запрашивать их с помощью стандартного SQL, а также использовать расширенные аналитические возможности Apache Iceberg, такие как транзакции на уровне строк, снимки с возможностью запроса, развитие схем и многое другое. В бакетах таблиц также доступно обслуживание таблиц на основе политик, что помогает автоматизировать такие эксплуатационные задачи, как сжатие, управление снимками и удаление файлов без ссылок.
Векторное хранилище
Открыть всеAmazon S3 Vectors предоставляет первое облачное хранилище объектов с встроенной поддержкой хранения векторов и запросов к ним. S3 Vectors обеспечивает экономичное, эластичное и надежное векторное хранилище, которое можно запрашивать на основе семантического значения и сходства. Он обеспечивает время ответа на запросы менее секунды и до 90% снижает затраты на загрузку, хранение и запрос векторов в нужном масштабе. Благодаря интеграции с Базами знаний Amazon Bedrock вы можете использовать S3 Vectors в качестве хранилища векторов и сократить затраты на примеры использования дополненной извлеченными данными генерации (RAG).
В S3 Vectors представлены векторные бакеты — тип бакетов, специально созданный для хранения векторов. Векторный бакет поддерживает специализированный набор API-интерфейсов для хранения, доступа и запроса векторов без необходимости выделять для этого какую-либо инфраструктуру. В векторном бакете вы организуете векторы в векторные индексы и можете эластично масштабировать до 10 000 векторных индексов в векторном бакете. При добавлении векторов в векторный индекс вы также можете прикрепить метаданные, чтобы ограничить будущие запросы на основе набора условий (например, дат, категорий и предпочтений пользователя). S3 Vectors полезны для самых разных примеров использования, например, для поиска подходящих песен для плейлистов, похожих видеороликов, соответствующих фрагментов кода, аналогичных рентгеновских снимков для диагностики или паттернов в журналах. S3 Vectors интегрируется с управляемым Сервисом Amazon OpenSearch Service, что позволяет оптимизировать затраты на хранение векторов, продолжая использовать API-интерфейсы OpenSearch для рабочих нагрузок, которые могут воспользоваться расширенными функциями поиска, включая гибридный поиск, агрегирование, расширенную фильтрацию и фасетный поиск. Можно также экспортировать векторы из S3 Vectors в бессерверный сервис OpenSearch Serverless для рабочих нагрузок, требующих выполнения запросов в реальном времени.
Файловое хранилище
Открыть всеФайлы S3 — это общая файловая система, обеспечивающая прямое подключение любых вычислительных ресурсов AWS к данным в Amazon S3. Она обеспечивает быстрый прямой доступ ко всем данным S3 в виде файлов с полной поддержкой семантики файловой системы и низкой задержкой, при этом данные не покидают S3. Это означает, что работающие с файлами приложения, агенты и рабочие группы теперь могут получать доступ к данным S3 и работать с ними как с файловой системой, применяя уже имеющиеся инструменты. Вам больше не потребуется дублировать данные или регулярно переносить их между объектным хранилищем и хранилищем файловой системы. Основанные на файлах средства и приложения организации теперь могут работать с данными S3 напрямую из любого вычислительного инстанса, контейнера или функции с использованием тех же инструментов, что уже применяются вашими специалистами и агентами.
Благодаря Файлам S3 решение Amazon S3 становится первым и единственным объектным хранилищем в облаке, предоставляющим доступ к полнофункциональной и высокопроизводительной файловой системе для ваших данных. Файлы S3 сочетают производительность и простоту файловой системы с масштабируемостью, надежностью и экономической эффективностью S3. В результате не возникает никаких обособленных баз данных, никаких сложностей синхронизации и никаких компромиссов. Хранилище файлов и объектов в едином расположении без компромиссов.
Классы хранилищ
Открыть всеAmazon S3 позволяет хранить данные в хранилищах S3 различных классов, которые подходят для различных стандартных примеров использования и шаблонов доступа: S3 Intelligent-Tiering, S3 Standard, S3 Express One Zone, S3 Standard-Infrequent Access (S3 Standard-IA), S3 One Zone-Infrequent Access (S3 One Zone-IA), S3 Glacier Instant Retrieval, S3 Glacier Flexible Retrieval, S3 Glacier Deep Archive и S3 Outposts.
Каждый класс хранилища S3 поддерживает определенный уровень доступа к данным по соответствующей цене или выбор географического местоположения.
Для данных с изменчивыми, неизвестными и непрогнозируемыми шаблонами доступа, как, например, для озер данных, аналитики или новых приложений, лучше использовать уровень S3 Intelligent-Tiering, на котором стоимость хранения оптимизируется автоматически. S3 Intelligent-Tiering автоматически перемещает данные между тремя уровнями доступа с низкой задержкой, оптимизированные для частого, нечастого и редкого доступа. Когда со временем небольшие наборы объектов отправляются в архив, можно активировать уровень архивного доступа, созданный для асинхронного доступа.
В разрезе прогнозируемых шаблонов доступа применима описанная далее схема. Критические важные производственные данные можно хранить в S3 Standard для частого доступа. Регулярно используемые данные можно хранить в S3 Express One Zone для ускорения критически важных приложений. Нечасто используемые данные можно отправить в S3 Standard-IA или S3 One Zone-IA для сокращения расходов. Архивировать данные по минимальной стоимости можно в архивных классах хранилища — S3 Glacier Instant Retrieval, S3 Glacier Flexible Retrieval и S3 Glacier Deep Archive. Можно использовать Анализ класса хранилища S3 для мониторинга шаблонов доступа к объектам, чтобы выявить данные, которые следует перенести в менее затратные классы хранилища. Затем эти сведения можно использовать для настройки политики Жизненного цикла S3, которая регулирует перенос данных. Вы также можете применять политики жизненного цикла S3 для принудительного истечения срока действия объектов по окончании их жизненного цикла.
Если ваши требования к локализации данных не могут быть выполнены в существующем Регионе AWS, вы можете использовать классы хранилищ S3 для Выделенных локальных зон AWS или S3 на стойках Outposts для хранения данных в определенном периметре данных.
Amazon S3 поддерживает примеры использования с локализацией и изоляцией данных, когда необходимо хранить данные в определенном периметре данных. Если ваши требования к локализации данных не могут быть выполнены в существующем Регионе AWS, вы можете использовать классы хранилищ S3 для Выделенных локальных зон AWS или S3 на стойках Outposts для хранения данных в определенном периметре данных. Обязательство AWS по цифровому суверенитету подразумевает, что мы предоставляем клиентам AWS наиболее совершенный инструментарий и функции для контроля суверенитета данных в облаке.
Управление доступом и безопасность
Открыть всеДля защиты данных в Amazon S3 по умолчанию пользователям предоставляется доступ только к созданным ими ресурсам S3. Вы можете предоставить доступ другим пользователям с помощью одной из следующих возможностей управления доступом или их сочетания: Управление идентификацией и доступом AWS (IAM) для создания пользователей и управления их доступом, Списки контроля доступа (ACL) для предоставления доступа к отдельным объектам авторизованным пользователям, политики бакетов для настройки разрешений для всех объектов в одной корзине S3, Точки доступа S3 для упрощения управления доступом к наборам общих данных путем создания точек доступа с именами и разрешениями для каждого приложения или набора приложений, разрешения на доступ к S3 для масштабирования разрешений данных путем автоматического предоставления конечным пользователям доступ к S3 в соответствии с особенностями организации, а также аутентификация строки запроса для предоставления ограниченного во времени доступа другим пользователям с помощью временных URL-адресов. Amazon S3 также поддерживает Журналы аудита, которые сохраняют запросы к ресурсам S3 для контроля действий пользователей и данных, которые они запрашивают.
Amazon S3 предоставляет гибкие возможности обеспечения безопасности для предотвращения доступа неавторизованных пользователей к данным. С помощью адреса VPC можно подключаться к ресурсам S3 из Amazon Virtual Private Cloud (Amazon VPC) и из локальной среды. Amazon S3 шифрует все новые данные, загруженные в любой бакет (по состоянию на 5 января 2023 года). Amazon S3 поддерживает шифрование на стороне сервера (с четырьмя вариантами управления ключами) и шифрование на стороне клиента для загрузки данных (дополнительные сведения о шифровании данных с помощью S3 см. в Руководстве пользователя Amazon S3). Используйте Инвентаризацию S3 для проверки статуса шифрования объектов S3 (подробнее об Инвентаризации S3 см. в разделе об управлении хранилищем).
S3 Block Public Access — это набор механизмов контроля безопасности, который позволяет запретить публичный доступ к бакетам и объектам S3. По умолчанию Block Public Access включен во всех новых бакетах. Достаточно нескольких нажатий клавиш в консоли Amazon S3, чтобы применить параметры S3 Block Public Access ко всем бакетам аккаунта AWS или только к некоторым бакетам S3. После того как параметры применены к аккаунту AWS, все существующие или новые бакеты и объекты, связанные с этим аккаунтом, будут наследовать параметры, запрещающие публичный доступ. Параметры Amazon S3 Block Public Access переопределяют другие разрешения S3. Благодаря этому администратору аккаунта легко обеспечить применение политики «Запрет публичного доступа» независимо от способа добавления объекта или создания бакета или существующих разрешений доступа. Механизмы контроля S3 Block Public Access поддерживают аудит, что предоставляет дополнительный уровень контроля, и используют проверки разрешений корзины AWS Trusted Advisor, журналы AWS CloudTrail и предупреждения Amazon CloudWatch. Необходимо включить параметр блокирования публичного доступа для всех аккаунтов и бакетов, которые не должны быть общедоступными.
S3 Object Ownership — это возможность, которая отключает Списки контроля доступа (ACL) и назначает владельца бакета владельцем всех объектов в нему, что позволяет упростить управление доступом к данным, сохраненным в S3. Когда вы настраиваете в S3 Object Ownership параметр Принудительное назначение владельца бакета, для этого бакета и размещенных в ней объектов более не применяются разрешения, заданные списками контроля доступа. Любой контроль доступа после этого определяется политиками на основе ресурсов, пользовательскими политиками или их сочетанием. Перед тем как отключать списки контроля доступа, ознакомьтесь с соответствующими списками для бакета и объекта. Чтобы определить запросы Amazon S3, требующие для авторизации списки контроля доступа, используйте поле aclRequired в журналах доступа сервера в Amazon S3 или AWS CloudTrail.
Используя Точки доступа S3 для сервиса Виртуальное частное облако (VPC), можно легко защитить брандмауэром данные S3 в своей частной сети. Кроме того, с помощью политик управления сервисами AWS можно требовать, чтобы для всех новых Точек доступа S3 в организации действовало ограничение, разрешающее доступ только из VPC.
IAM Access Analyzer для S3 — это возможность, которая упрощает управление разрешениями по мере назначения, проверки и уточнения политик для точек доступа и бакетов S3. Access Analyzer для S3 выполняет мониторинг существующих политик доступа к бакетам и предоставляет к ресурсам S3 исключительно требуемый доступ. Access Analyzer для S3 оценивает политики доступа к корзинам, что позволяет быстро отключить нежелательный доступ к любой корзине. При проверке результатов, указывающих на возможный общий доступ к корзине, можно заблокировать публичный доступ к корзине одним нажатием в консоли S3. В целях аудита результаты работы сервиса Access Analyzer для S3 можно загрузить в виде CSV‑отчета. Кроме того, по мере авторизации политик S3 на консоли S3 отображаются предупреждения, ошибки и предложения в разрезе безопасности от IAM Access Analyzer. Консоль автоматически проводит более 100 проверок политик для подтверждения ваших политик. Эти проверки экономят ваше время, а также предоставляют возможность исправить ошибки и применить рекомендации в отношении безопасности.
С помощью IAM легче анализировать доступ и уменьшить число разрешений для предоставления минимума полномочий путем проставления метки времени с информацией о том, когда пользователь или роль в последний раз использовали S3 и выполняли связанные с этим действия. Используйте информацию о последнем доступе, чтобы анализировать доступ к S3, идентифицировать неиспользованные разрешения и уверенно удалять их. Подробные сведения см. в разделе Удаление разрешений с помощью данных о последнем доступе.
Сервис Amazon Macie можно использовать для обнаружения и защиты конфиденциальных данных, которые хранятся в Amazon S3. Macie автоматически собирает полный реестр S3 и непрерывно оценивает каждый бакет, чтобы предупреждать о наличии любых общедоступных или незашифрованных бакетов, а также бакетов, совместно используемых с аккаунтами AWS за пределами организации или реплицируемых в такие аккаунты. Затем сервис Macie применяет методы машинного обучения и сопоставления с шаблонами к выбранным корзинам, чтобы распознавать конфиденциальные данные, например персональную информацию, и отправлять уведомления о них. По мере генерирования полученные данные о безопасности рассылаются в События Amazon CloudWatch, что облегчает интеграцию с существующими системами управления рабочими процессами, а также позволяет запустить автоматическое устранение неполадок с помощью сервисов типа AWS Step Functions и выполнять такие действия, как закрытие общедоступного бакета или добавление тегов ресурсов.
AWS PrivateLink для S3 обеспечивает частное подключение между Amazon S3 и локальной средой. Вы можете предоставить интерфейсные адреса VPC для S3 в VPC для подключения локальных приложений непосредственно к S3 по AWS Direct Connect или AWS VPN. Запросы к конечным точкам интерфейса VPC для S3 автоматически перенаправляются в S3 по сети Amazon. Вы можете создать группы безопасности и настроить политики адресов VPC для адресов интерфейса VPC, чтобы пользоваться дополнительными возможностями управления доступом.
Подробнее см. в разделах об управлении доступом и безопасности в S3, защите данных в Amazon S3, а также в электронной книге по безопасности и защите данных S3.
Обработка данных
Открыть всеС помощью функции S3 Object Lambda вы сможете добавлять собственный код в запросы S3 GET, HEAD и LIST, чтобы изменять и обрабатывать данные, возвращаемые в приложение. Вы можете применить пользовательский код для изменения данных, возвращаемых стандартными запросами S3 GET, для фильтрации строк, динамического изменения размера изображений, удаления конфиденциальных данных и многого другого. Вы также можете использовать S3 Object Lambda для изменения результатов запросов S3 LIST, чтобы создать пользовательское представления объектов в корзине и запросы S3 HEAD с целью изменения метаданных объекта, таких как его имя и размер. Выполнение кодов на базе функций AWS Lambda осуществляется в инфраструктуре, полностью управляемой AWS, что устраняет необходимость в создании и хранении производных копий данных или запуске дорогостоящих прокси, при этом не нужно вносить какие-либо изменения в приложения.
В S3 Object Lambda автоматическая обработка выходных данных стандартного запроса S3 GET, HEAD или LIST осуществляется с помощью функций AWS Lambda. AWS Lambda — это бессерверный вычислительный сервис, выполняющий заданный пользователем код без необходимости управления базовыми вычислительными ресурсами. Чтобы начать настройку функции Lambda и прикрепить ее к точке доступа S3 Object Lambda, достаточно нескольких щелчков мышью в консоли управления AWS. С этого момента S3 будет автоматически вызывать функцию Lambda для обработки любых данных, полученных через точку доступа S3 Object Lambda, а приложение будет получать преобразованный результат. Вы сможете создавать и выполнять собственные пользовательские функции Lambda, адаптируя процесс преобразования данных S3 объекта Lambda для конкретного примера использования.
Запросы к данным без извлечения
Открыть всеAmazon S3 предоставляет дополнительные сервисы, которые запрашивают данные без необходимости в копировании и загрузке на отдельную аналитическую платформу или в хранилище данных. Это значит, что аналитику данных можно проводить непосредственно на данных, которые хранятся в Amazon S3.
Amazon S3 совместим с аналитическими сервисами AWS Amazon Athena и Amazon Redshift Spectrum. Amazon Athena запрашивает данные из Amazon S3 без извлечения и загрузки в отдельный сервис или платформу. Он использует стандартные выражения SQL для анализа данных, предоставления результатов за считаные секунды, а также часто применяется для специализированного обнаружения данных. Amazon Redshift Spectrum также выполняет SQL-запросы напрямую к данным местах хранения в Amazon S3 и больше подходит для сложных запросов и крупных наборов данных (размером до нескольких экзабайт). Так как Amazon Athena и Amazon Redshift используют общие форматы и каталог данных, их можно использовать для одинаковых наборов данных в Amazon S3.
Чтобы подробнее узнать о запросах данных в Amazon S3, прочтите публикацию в блоге.
Передача данных
Открыть всеAWS предлагает целый набор сервисов передачи данных, и вы можете выбрать нужное решение для любого проекта по миграции данных. При миграции данных уровень подключения — очень важный фактор, и у AWS есть предложения, которые могут удовлетворить ваши потребности в гибридном облачном хранилище, а также в переносе данных по сети и в автономном режиме.
Хранение в гибридном облаке. Шлюз хранилища AWS — это сервис гибридного облачного хранилища, который позволяет без особых усилий подключать ваши локальные приложения к хранилищу AWS. Клиенты используют сервис Шлюз хранилища, чтобы без особого труда заменять ленточные библиотеки облачным хранилищем, создавать файловые ресурсы на основе облачного хранилища или кеши с малыми задержками для доступа локальных приложений к данным в AWS.
Передача данных онлайн. Сервис AWS DataSync позволяет просто и эффективно передавать сотни терабайтов и миллионы файлов в сервис Amazon S3 на порядок быстрее, чем средства с открытым исходным кодом. Сервис DataSync автоматически выполняет многие ручные задачи или устраняет необходимость их выполнения. Перечень таких задач включает написание скриптов заданий копирования, составление расписаний и отслеживание передачи данных, проверку данных и оптимизацию использования сети. Кроме того, вы можете использовать AWS DataSync для копирования объектов из бакета S3 в Outposts в бакет, расположенный в Регионе AWS, или наоборот. Семейство для пересылки файлов AWS обеспечивает полностью управляемую передачу файлов в сервис Amazon S3 с использованием протоколов SFTP, FTPS и FTP. Ускорение передачи данных Amazon S3 позволяет быстро передавать файлы на большие расстояния между клиентом и бакетом Amazon S3.
Передача данных в автономном режиме/с минимальным подключением или без него. В сервисе AWS Snowball для сбора, обработки и миграции данных используются защищенные портативные накопители и устройства периферийных вычислений. Клиенты могут отправлять физические устройства Snowball в AWS для миграции данных без использования сети.
Сотрудничая со сторонними поставщиками из Партнерской сети AWS (APN), клиенты также могут развертывать гибридные архитектуры с хранилищем данных, интегрировать Amazon S3 в существующие приложения и рабочие процессы и переносить данные из сервисов AWS и в них.
Дополнительные сведения см. в разделах Сервисы миграции данных для Облака AWS, Шлюз хранилища AWS, AWS DataSync, Семейство для пересылки файлов AWS, Ускорение передачи данных Amazon S3 и AWS Snowball.
Обмен данными
Открыть всеОбмен данными AWS для Amazon S3 ускоряет время получения информации благодаря прямому доступу к данным Amazon S3 от поставщиков данных. Обмен данными AWS для Amazon S3 помогает легко искать данные, подписываться на них и использовать файлы данных сторонних производителей для оптимизации затрат на хранение, упрощенного управления лицензированием данных и многого другого. Эта функция предназначена для подписчиков, которые хотят легко использовать файлы данных сторонних производителей для анализа данных с помощью сервисов AWS без необходимости создавать копии данных или управлять ими. Это также полезно для поставщиков данных, которые хотят предложить доступ к данным, размещенным в бакетах Amazon S3.
Как только подписчики получают право на набор данных в сервисе Обмена данными AWS для Amazon S3, они могут начать анализ данных без необходимости создавать собственные бакеты S3, копировать файлы данных в эти бакеты S3 или вносить соответствующую плату за хранение. Анализ данных можно проводить с помощью таких сервисов AWS, как Amazon Athena, «Хранилище функций Amazon SageMaker» или Amazon EMR. Подписчики получают доступ к тем же объектам S3, которые поддерживает поставщик данных, и поэтому всегда используют самые актуальные данные, без дополнительной инженерной или операционной работы. Поставщики данных могут легко установить сервис Обмена данными AWS для Amazon S3 поверх существующих бакетов S3 для предоставления прямого доступа ко всему бакету S3 или к определенным префиксам и объектам S3. После установки сервис Обмена данными AWS автоматически управляет подписками, правами, выставлением счетов и оплатой.
Производительность
Открыть всеВ Amazon S3 предоставляется лучшая в отрасли производительность для хранения объектов в облаке. Amazon S3 поддерживает параллельные запросы, благодаря чему производительность S3 можно масштабировать с помощью коэффициента вычислительного кластера, не внося изменения в приложение. Производительность масштабируется для каждого префикса, благодаря чему для достижения необходимой пропускной способности можно параллельно использовать необходимое количество префиксов. Количество префиксов не ограничено. В Amazon S3 можно осуществлять не менее 3500 запросов в секунду на добавление данных и 5500 запросов в секунду на их извлечение. Каждый префикс S3 может обеспечивать такие значения, благодаря чему значительно повысить производительность довольно просто.
Для достижения такой скорости обработки запросов в S3 не нужно настраивать генерацию случайных префиксов объектов. Это означает, что можно использовать логический или последовательный шаблон присвоения имен объектам S3 без отрицательного влияния на производительность. Чтобы получить актуальную информацию об оптимизации производительности в Amazon S3, см. рекомендации по повышению производительности в Amazon S3 и шаблоны производительности в Amazon S3.
Amazon S3 автоматически тщательно проверяет согласованность операций чтения после записи во всех приложениях. Этот процесс не влияет на производительность или доступность и региональную изолированность приложений, а также абсолютно бесплатный. Благодаря Строгой согласованности S3 упрощается миграция локальных аналитических рабочих нагрузок, устраняя необходимость вносить изменения в приложения и снижая затраты из-за отсутствия потребности в дополнительной инфраструктуре для тщательной проверки согласованности.
Все запросы к хранилищу S3 тщательно согласовываются. После успешной записи нового объекта или повторной записи существующего все последующие запросы на чтение незамедлительно получают последнюю версию объекта. S3 также тщательно проверяет согласованность операций получения списка, благодаря чему сразу после записи вы сможете создать список объектов в бакете со всеми внесенными изменениями.
Надлежащее использование и ограничения
Использование данного сервиса регламентируется Клиентским соглашением Amazon Web Services.